Geração de Tráfego Auto-Similar e Estimação do Parâmetro de Hurst através do método R/S
description
Transcript of Geração de Tráfego Auto-Similar e Estimação do Parâmetro de Hurst através do método R/S
Geração de Tráfego Auto-Similar e Estimação do Parâmetro de Hurst
através do método R/S
Thiago Souto Maior
Roteiro
Geração de tráfego Relação Paretto/Hurst Quantidade de fontes Teste R/S Relação R/S com Hurst Ferramentas Referências
Geração de Tráfego
Utilizado o modelo On-Off Baseado em tempo de transmissão e tempo
de espera Normalmente possui um tamanho fixo de
pacote Esses tempos são regidos por uma
distribuição de cauda pesada– Paretto, Weibull, Lognormal...
Geração de Tráfego a partir da Paretto
Relação entre o parâmetro α (shape) da Paretto e o parâmetro de Hurst, para geração de tráfego através do modelo On-Off
2
3 H
Precisão do parâmetro gerado
Parâmetro de Hurst gerado a partir do modelo On-Off com a Paretto tem uma variação relativa à quantidade de fontes On-Off
Quanto mais fontes menor a variabilidade 50 a 100 fontes
– Esforço computacional maior– Variabilidade estaciona em valores pequenos
20 fontes já alcançam valores com variabilidade baixa
Extração do Parâmetro de Hurst através de dados de Vazão
Utilização de Testes estatísticos– R/S– V/S– Var[R/S]
Quanto maior a massa de dados, melhor o resultado
Quanto menor o intervalo de captura, mais preciso o resultado
Teste R/S
Sejam h(1), h(2), h(3), …, h(n) dados de uma determinada série temporal
Calcula-se a média desses dados
Calcula-se os desvios da média
– Note que o conjunto “x” tem média zero
n
i
ihn
M )(1
niMihix 1,)()(
Teste R/S
Calcula-se as somas dos desvios
Considera-se o maior e o menor valor do conjunto Y R(n) = max(Y(1..n)) – min(Y(1..n))
– Range
MijhiYi
j
)()(
i
j
jxiY )()(
Teste R/S
O valor do teste é calculado dividindo R(n) pelo desvio padrão (R(n)/s(n))– O resultado é chamado “Rescaled range”
Relação do R/S com Hurst
Temos que numa série de variáveis randômicas com desvio padrão finito e sem dependências, a estatística R/S cresce proporcionalmente a n½
– E[R/s] = cn½, sendo “c” uma constante
Sendo assim:– log(E[R/s]) = log(c) + (1/2) log(n)
Se plotarmos log(E[R/s]) x log(n), teremos aproximadamente uma linha reta com inclinação de 0.5
Relação do R/S com Hurst
O que Hurst achou foi– Quando os dados possuem dependência, a
inclinação da reta é sempre maior que 0.5 e obedecem à expressão
– E[R/s] = cnH, sendo “c” uma constante e “H” o parâmetro de Hurst
log(E[R/s]) = log(c) + H log(n)– Plotando num gráfico log(E[R/s]) x log(n), H seria
a inclinação da reta correspondente ao gráfico
Relação de R/S com Hurst
O gráfico deve ser feito em diversas escalas de “n” para provar a dependência em várias escalas
O gráfico terá uma aparência de pontos esparsos (scattered plot)
A reta construída para extrair o parâmetro de Hurst pode ser computada a partir de uma regressão linear com os pontos do gráfico
Ferramentas
R– Para calcular regressão linear – Comando lm(x ~ y)– Pode ser implementado o teste R/S
Código em C– http://www.csee.usf.edu/~christen/tools/rs.c
Referências
Accurate and Fast Replication on the Generation of Fractal Network Traffic Using Alternative Probability Models, Stenio Fernandes, Carlos Kamienski & Djamel Sadok
Hurst, http://gummy-stuff.org/hurst.htm