Criando gráficos tipo pizza no R com informações agrupadas
Para uma base de dados tipo:
Masculino | Feminino
0 | 1
1 | 0
1 | 0
1 | 0
1 | 0
0 | 1
Onde se somam os valores com 1 das colunas para se saber o total de cada coluna.
f = read.table(file="C:\\Downloads\\LLING.csv", sep=";", header=TRUE)
masc<-c(f$Masculino[which(f$Curso=="LLING")], f$Masculino[which(f$Curso=="BAGP")])
fem<-c(f$Feminino[which(f$Curso=="LLING")], f$Feminino[which(f$Curso=="BAGP")])
#o "c" é de concatenar os elementos, formando um vetor com todos os elementos
mascling <- f$Masculino[which(f$Curso=="LLING")]
mascbagp <- f$Masculino[which(f$Curso=="BAGP")]
femling <- f$Feminino[which(f$Curso=="LLING")]
fembagp <- f$Feminino[which(f$Curso=="BAGP")]
x <- c(sum(mascling), sum(mascbagp))
y <- c(sum(femling), sum(fembagp))
xy <- c(sum(mascling+mascbagp),sum(femling+fembagp))
par(mfrow=c(2,2))
colors <- rainbow(length(x))
pie_labels <- round(x/sum(x) * 100, 1)
pie_labels <- paste(pie_labels, "%", sep="")
pie(x, main="Relatório Personográfico - Sexo - Masculino", col=colors, labels=pie_labels,
cex=0.8)
legend(1.5, 0.5, c("LLING","BAGP"), cex=0.8, fill=colors)
box()
colors <- rainbow(length(y))
pie_labels <- round(y/sum(y) * 100, 1)
pie_labels <- paste(pie_labels, "%", sep="")
pie(y, main="Relatório Personográfico - Sexo - Feminino", col=colors, labels=pie_labels,
cex=0.8)
legend(1.5, 0.5, c("LLING","BAGP"), cex=0.8, fill=colors)
box()
colors <- rainbow(length(xy))
pie_labels <- round((xy)/sum(xy) * 100, 1)
pie_labels <- paste(pie_labels, "%", sep="")
pie(xy, main="Relatório Personográfico - Sexo", col=colors, labels=pie_labels, cex=0.8)
legend(1.5, 0.5, c("Masculino","Feminino"), cex=0.8, fill=colors)
box()
É o blog do Emanuel!!!
Aqui serão postados assuntos diversos: viagens, informática e tecnologia de uma forma geral.
Como sou professor e trabalho com Computação em Nuvens (Cloud Computing), muitas vezes os posts serão sobre assuntos relacionados ao mundo acadêmico, como congressos. Mas tem de tudo um pouco!
sexta-feira, 22 de junho de 2012
segunda-feira, 18 de junho de 2012
SBRC2013 - Brasília
http://sbrc2013.unb.br/
6 a 10 de maio de 2013 - Brasília
http://sbrc2013.unb.br/wp-content/uploads/2012/04/cfp-ptbr.pdf
O Simpósio Brasileiro de Redes de Computadores e Sistemas Distribuídos (SBRC) é um evento anual promovido pela Sociedade Brasileira de Computação (SBC) e pelo Laboratório Nacional de Redes de Computadores (LARC). Ao longo dos anos, o SBRC tornou-se o mais importante evento científico nacional em redes de computadores e sistemas distribuídos do país, e um dos mais concorridos em Informática. O SBRC congrega grande parte da comunidade nacional com interesse na área, seja originada do meio acadêmico, seja do meio empresarial e industrial. As últimas edições do simpósio receberam uma média de 1.000 participantes, incluindo professores e pesquisadores nacionais e internacionais, profissionais de empresas, representantes de órgãos governamentais e alunos de graduação e pós-graduação.
Em sua 31ª edição, o Simpósio será realizado de 6 a 10 de maio de 2013 em Brasília, DF. A realização do evento está sob a responsabilidade conjunta dos Departamentos de Ciência da Computação (CIC) e Engenharia Elétrica (ENE) da Universidade de Brasília (UnB). O evento será composto de sessões técnicas, minicursos, painéis e debates, workshops, salão de ferramentas, palestras e tutoriais proferidos por convidados de renome internacional. Chamadas específicas para as diversas atividades do SBRC serão oportunamente divulgadas. Os autores dos melhores artigos selecionados para publicação e apresentação no SBRC 2013 serão convidados a submeter uma versão estendida de seus trabalhos para a Revista Brasileira de Redes de Computadores e Sistemas Distribuídos (RB-RESD).
LatinCloud 2012
LatinCloud 2012
http://www.ieee-latincloud.org/
PORTO ALEGRE, BRAZIL - 26,27 NOV 2012 - CALL FOR PAPERS
The Cloud Computing and communications paradigm has defined
unprecedented business models, promoting on-demand computing resource
allocation, elastic scaling, and elimination of up-front costs.
Capitalizing on paradigms such as virtualization, utility computing,
grid computing, and service oriented architectures, cloud computing
and communications has already changed the way we compute and
communicate. To cope with numerous technological challenges for the
support of diverse services and application, the First IEEE Latin
American Conference on Cloud Computing and Communications invites your
submission.
Topics of interest
Prospective authors are cordially invited to submit their original
contributions covering completed or ongoing work related to the field
of cloud computing and communications. The topics include but are not
limited to:
Cloud architectures
Infrastructure core services
SaaS/PaaS/IaaS/NaaS
Public, private, and hybrid clouds
Cloud-based multimedia services
Green Clouds
Cloud management
Mobile Cloud services
Social network in Clouds
Federated Clouds
Virtualization platforms
Middeware for cloud environments
Network architecture for data center
Optical interconnects
Mechanisms and protocols to support QoS/QoE
Service level agreements and business models
Resource provisioning and scheduling
Cloud platforms and testbeds
Load balancing
Policy driven service/resource life-cycle management
Privacy and security
Measurement and Monitoring
Dependability and fault tolerance
Performance evaluation and modeling
Applications and services enabled by virtualized infrastructures
Data management in Clouds
Metadata and schemas
Service-oriented architecture in Cloud computing
Service composition and orchestration
Management of scientific models and workflows
Cloud computing and communications in industry and IT business
Análise de Desempenho com Benchmarks em um Ambiente Público de Computação em Nuvem
Artigo aceito e apresentado no X Workshop em Clouds e Aplicações - WCGA, que ocorreu em Ouro Preto/MG em conjunto com o SBRC2012.
Análise de Desempenho com Benchmarks em um Ambiente Público de Computação em Nuvem
Abstract:
Cloud Computing environments are becoming increasingly common.
Its use by users is becoming easier because of the simplicity of use. On the other hand, many environments are emerging providing various services for users, making it difficult to choose which provider to be hired. This article aims to conduct a performance analysis on a public environment of cloud computing, HP Cloud Services, on aspects of CPU, memory, I/O and network through benchmarks. As a result, this study compared the outputs of the benchmarks for the different instances of the environment, showing that the selection of the provider will depend on many varied characteristics.
Resumo:
Ambientes de Computação em Nuvem estão se tornando cada vez mais comuns. A sua utilização por usuários está cada vez mais fácil devido à simplicidade de uso. Por outro lado, muitos ambientes estão surgindo e disponibilizando serviços diversos para os usuários, tornando difícil a escolha do provedor a ser contratado. Este artigo tem como objetivo realizar uma análise de desempenho sobre um ambiente público de computação em nuvem, o HP Cloud Services, sobre aspectos de CPU, memória, I/O e rede, através de benchmarks. Como resultados, este trabalho comparou as saídas dos benchmarks para tipos variados de instâncias do ambiente, mostrando que a seleção do provedor vai depender de muitas características variadas, e que o desempenho é influenciado por diversos fatores.
Gráfico de Degrau no R
Apanhei muito, mas era uma besteira...
f = read.table(file="C:\\Downloads\\fair.txt",
sep=";",
header=FALSE,
skip = 0,
dec=".",
row.names = NULL,
colClasses <- rep("numeric",3),
comment.char = "#",
na.strings = c("*", "-",-99.9, -999.9),
col.names <- c("tempo", "taxa") )
plot(taxa~tempo, f, col=4, ylim = c(0, 6), type=c("s"), xlab="Execution Time (minutes)", ylab="Workload (httperf rate)", main="Workload at Time", lwd=3, xaxs="i", yaxs="i", font.axis=2, font.lab=2)
f = read.table(file="C:\\Downloads\\fair.txt",
sep=";",
header=FALSE,
skip = 0,
dec=".",
row.names = NULL,
colClasses <- rep("numeric",3),
comment.char = "#",
na.strings = c("*", "-",-99.9, -999.9),
col.names <- c("tempo", "taxa") )
plot(taxa~tempo, f, col=4, ylim = c(0, 6), type=c("s"), xlab="Execution Time (minutes)", ylab="Workload (httperf rate)", main="Workload at Time", lwd=3, xaxs="i", yaxs="i", font.axis=2, font.lab=2)
Várias funções que utilizo no R
Seguem algumas funções que normalmente utilizo nos meus artigos.
O R pode ser obtido de http://cran.r-project.org/.
Ler arquivo
f = read.table(file="C:\\Downloads\\resultado.txt",sep=";",header=TRUE)
separador enter coluna o ";"
separador decimal o "."
Mostrar informações estatísticas
> summary(f)
CPU ON AMAZON
Min. :0.05239 Min. :0.005996 Min. :0.05323
1st Qu.:0.12850 1st Qu.:0.132863 1st Qu.:0.13046
Median :0.14586 Median :0.150601 Median :0.15615
Mean :0.22330 Mean :0.323834 Mean :0.61537
3rd Qu.:0.18229 3rd Qu.:0.186492 3rd Qu.:0.27418
Max. :6.74142 Max. :6.567323 Max. :6.49501
Desvio padrão
> sd(f)
CPU ON AMAZON
0.4042940 0.7079139 1.1460376
Erro padrão médio
> 100*sd(f)/mean(f)
CPU ON AMAZON
181.0572 218.6043 186.2357
Gráficos
> boxplot(f)
> hist(f$CPU)
> hist(f$ON)
> hist(f$AMAZON)
> plot(f$CPU)
> plot(f$ON)
> plot(f$AMAZON)
> matplot(f, type = 'l')
par(mfrow=c(1,3))
par(ps=18)
plot(f$CPU, col=2, xlab="CPU", ylab="Segundos")
plot(f$ON, col=3, xlab="MV Privada", ylab="Segundos")
plot(f$AMAZON, col=4, xlab="MV Pública", ylab="Segundos")
par(mfrow=c(1,3))
par(ps=18)
boxplot(f$CPU, col=2, xlab="CPU", ylab="Segundos")
boxplot(f$ON, col=3, xlab="MV Privada", ylab="Segundos")
boxplot(f$AMAZON, col=4, xlab="MV Pública", ylab="Segundos")
par(mfrow=c(1,3))
par(ps=18)
hist(f$CPU, col=2, xlab="CPU", ylab="Segundos")
hist(f$ON, col=3, xlab="MV Privada", ylab="Segundos")
hist(f$AMAZON, col=4, xlab="MV Pública", ylab="Segundos")
par(mfrow=c(1,3))
par(ps=18)
matplot(f$CPU, type="l", col=2, xlab="CPU", ylab="Segundos")
matplot(f$ON, type="l", col=3, xlab="MV Privada", ylab="Segundos")
matplot(f$AMAZON, type="l", col=4, xlab="MV Pública", ylab="Segundos")
Intervalo de confiança
> t.test(f$CPU)
One Sample t-test
data: f$CPU
t = 38.1655, df = 4774, p-value < 2.2e-16
alternative hypothesis: true mean is not equal to 0
95 percent confidence interval:
0.2118261 0.2347664
sample estimates:
mean of x
0.2232962
> t.test(f$ON)
One Sample t-test
data: f$ON
t = 31.6103, df = 4774, p-value < 2.2e-16
alternative hypothesis: true mean is not equal to 0
95 percent confidence interval:
0.3037495 0.3439176
sample estimates:
mean of x
0.3238335
> t.test(f$AMAZON)
One Sample t-test
data: f$AMAZON
t = 37.1043, df = 4774, p-value < 2.2e-16
alternative hypothesis: true mean is not equal to 0
95 percent confidence interval:
0.5828555 0.6478835
sample estimates:
mean of x
0.6153695
O R pode ser obtido de http://cran.r-project.org/.
Ler arquivo
f = read.table(file="C:\\Downloads\\resultado.txt",sep=";",header=TRUE)
separador enter coluna o ";"
separador decimal o "."
Mostrar informações estatísticas
> summary(f)
CPU ON AMAZON
Min. :0.05239 Min. :0.005996 Min. :0.05323
1st Qu.:0.12850 1st Qu.:0.132863 1st Qu.:0.13046
Median :0.14586 Median :0.150601 Median :0.15615
Mean :0.22330 Mean :0.323834 Mean :0.61537
3rd Qu.:0.18229 3rd Qu.:0.186492 3rd Qu.:0.27418
Max. :6.74142 Max. :6.567323 Max. :6.49501
Desvio padrão
> sd(f)
CPU ON AMAZON
0.4042940 0.7079139 1.1460376
Erro padrão médio
> 100*sd(f)/mean(f)
CPU ON AMAZON
181.0572 218.6043 186.2357
Gráficos
> boxplot(f)
> hist(f$CPU)
> hist(f$ON)
> hist(f$AMAZON)
> plot(f$CPU)
> plot(f$ON)
> plot(f$AMAZON)
> matplot(f, type = 'l')
par(mfrow=c(1,3))
par(ps=18)
plot(f$CPU, col=2, xlab="CPU", ylab="Segundos")
plot(f$ON, col=3, xlab="MV Privada", ylab="Segundos")
plot(f$AMAZON, col=4, xlab="MV Pública", ylab="Segundos")
par(mfrow=c(1,3))
par(ps=18)
boxplot(f$CPU, col=2, xlab="CPU", ylab="Segundos")
boxplot(f$ON, col=3, xlab="MV Privada", ylab="Segundos")
boxplot(f$AMAZON, col=4, xlab="MV Pública", ylab="Segundos")
par(mfrow=c(1,3))
par(ps=18)
hist(f$CPU, col=2, xlab="CPU", ylab="Segundos")
hist(f$ON, col=3, xlab="MV Privada", ylab="Segundos")
hist(f$AMAZON, col=4, xlab="MV Pública", ylab="Segundos")
par(mfrow=c(1,3))
par(ps=18)
matplot(f$CPU, type="l", col=2, xlab="CPU", ylab="Segundos")
matplot(f$ON, type="l", col=3, xlab="MV Privada", ylab="Segundos")
matplot(f$AMAZON, type="l", col=4, xlab="MV Pública", ylab="Segundos")
Intervalo de confiança
> t.test(f$CPU)
One Sample t-test
data: f$CPU
t = 38.1655, df = 4774, p-value < 2.2e-16
alternative hypothesis: true mean is not equal to 0
95 percent confidence interval:
0.2118261 0.2347664
sample estimates:
mean of x
0.2232962
> t.test(f$ON)
One Sample t-test
data: f$ON
t = 31.6103, df = 4774, p-value < 2.2e-16
alternative hypothesis: true mean is not equal to 0
95 percent confidence interval:
0.3037495 0.3439176
sample estimates:
mean of x
0.3238335
> t.test(f$AMAZON)
One Sample t-test
data: f$AMAZON
t = 37.1043, df = 4774, p-value < 2.2e-16
alternative hypothesis: true mean is not equal to 0
95 percent confidence interval:
0.5828555 0.6478835
sample estimates:
mean of x
0.6153695
Assinar:
Postagens (Atom)