Polticas de Gerenciamento de Conte´ı udo Gerado por Usu...

14
Pol´ ıticas de Gerenciamento de Conte ´ udo Gerado por Usu ´ arios em Sistemas CDN-P2P J. M. Lib´ orio Filho 1 , Cesar A.V. Melo 2 , Nelson L.S. da Fonseca 3 1 Instituto de Ciˆ encia Exatas e Tecnologia 2 Instituto de Computac ¸˜ ao Universidade Federal do Amazonas Manaus – AM – Brasil. {liborio filho, cavmelo}@icomp.ufam.edu.br 3 Instituto de Computac ¸˜ ao – Universidade de Campinas Campinas – SP – Brasil [email protected] Abstract. In this paper, we study the effectiveness of object management policies based on users’ personal signals, available on YouTube-like content distribution systems, for improving content availability in P2P-CDN systems. Four policies are introduced and evaluated using real data collected from YouTube video col- lection, the most accessed multimedia distribution system in the Internet. We found that these policies can improve content availability, over 70%, when com- pared to the LFU policy, and over 20%, when compared to the GDSP policy, in a hybrid P2P-CDN content distribution system. Resumo. Neste artigo, estuda-se a efetividade de pol´ ıticas de gerenciamento de objetos derivadas a partir de informac ¸˜ oes coletadas em sistemas de distribuic ¸˜ ao de conte´ udo similar ao YouTube. Tais pol´ ıticas s˜ ao implementadas com o intui- to de melhorar a disponibilidade de conte´ udo em sistemas CDN-P2P. Quatro pol´ ıticas foram concebidas e avaliadas usando dados reais obtidos a partir da colec ¸˜ ao de v´ ıdeo do YouTube, o sistema de distribuic ¸˜ ao de conte´ udo multim´ ıdia mais acessado da Internet. Verificou-se que em uma rede CDN-P2P, as pol´ ıticas propostas foram capazes de melhorar a disponibilidade do conte´ udo, em al- guns caso, em mais de 70%, comparado a disponibilidade proporcionada pela pol´ ıtica LFU, e mais de 50%, comparado a pol´ ıtica GDSP. 1. Introduc ¸˜ ao A sinergia entre redes Par-a-Par(P2P) e Rede de Distribuic ¸˜ ao de Conte´ udo, do inglˆ es Con- tent Distribution Network-(CDN), tem permitido a oferta de servic ¸os de v´ ıdeo em larga escala. Sistemas h´ ıbridos, que capitalizam nas vantagens das redes P2P e das CDN, tˆ em sido viabilizados [GridNetworks 2012, Yin et al. 2009]. Nesses sistemas, pares compar- tilham seus recursos, diminuindo a demanda sobre a infra-estrutura da CDN, e os servi- dores da CDN garantem a disponibilidade de conte´ udo quando a contribuic ¸˜ ao dos pares ´ e limitada pelo churn, que ´ e o efeito gerado pelos ciclos de entrada e sa´ ıda de pares, ou quando o conte´ udo n˜ ao tiver sido acessado por pares da rede P2P. 74 Anais

Transcript of Polticas de Gerenciamento de Conte´ı udo Gerado por Usu...

Page 1: Polticas de Gerenciamento de Conte´ı udo Gerado por Usu ...classes/coppe-redes-2012/trabalho/WP2P-ST2-3(1… · A sinergia entre redes Par-a-Par(P2P) e Rede de Distribuic¸a˜o

Polıticas de Gerenciamento de Conteudo Gerado por Usuariosem Sistemas CDN-P2P

J. M. Lib orio Filho 1, Cesar A.V. Melo2, Nelson L.S. da Fonseca3

1 Instituto de Ciencia Exatas e Tecnologia

2Instituto de ComputacaoUniversidade Federal do Amazonas

Manaus – AM – Brasil.

{liborio filho, cavmelo}@icomp.ufam.edu.br

3Instituto de Computacao – Universidade de CampinasCampinas – SP – Brasil

[email protected]

Abstract. In this paper, we study the effectiveness of object management policiesbased on users’ personal signals, available on YouTube-like content distributionsystems, for improving content availability in P2P-CDN systems. Four policiesare introduced and evaluated using real data collected from YouTube video col-lection, the most accessed multimedia distribution system in the Internet. Wefound that these policies can improve content availability, over 70%, when com-pared to the LFU policy, and over 20%, when compared to the GDSP policy, ina hybrid P2P-CDN content distribution system.

Resumo. Neste artigo, estuda-se a efetividade de polıticas de gerenciamento deobjetos derivadas a partir de informacoes coletadas em sistemas de distribuicaode conteudo similar ao YouTube. Tais polıticas sao implementadas com o intui-to de melhorar a disponibilidade de conteudo em sistemas CDN-P2P. Quatropolıticas foram concebidas e avaliadas usando dados reais obtidos a partir dacolecao de vıdeo do YouTube, o sistema de distribuicao de conteudo multimıdiamais acessado da Internet. Verificou-se que em uma rede CDN-P2P, as polıticaspropostas foram capazes de melhorar a disponibilidade do conteudo, em al-guns caso, em mais de 70%, comparado a disponibilidade proporcionada pelapolıtica LFU, e mais de 50%, comparado a polıtica GDSP.

1. Introducao

A sinergia entre redes Par-a-Par(P2P) e Rede de Distribuicao de Conteudo, do inglesCon-tent Distribution Network-(CDN), tem permitido a oferta de servicos de vıdeo em largaescala. Sistemas hıbridos, que capitalizam nas vantagens das redes P2P e das CDN, temsido viabilizados [GridNetworks 2012, Yin et al. 2009]. Nesses sistemas, pares compar-tilham seus recursos, diminuindo a demanda sobre a infra-estrutura da CDN, e os servi-dores da CDN garantem a disponibilidade de conteudo quando a contribuicao dos parese limitada pelochurn, que e o efeito gerado pelos ciclos de entrada e saıda de pares, ouquando o conteudo nao tiver sido acessado por pares da rede P2P.

74 Anais

Page 2: Polticas de Gerenciamento de Conte´ı udo Gerado por Usu ...classes/coppe-redes-2012/trabalho/WP2P-ST2-3(1… · A sinergia entre redes Par-a-Par(P2P) e Rede de Distribuic¸a˜o

Contudo, sistemas hıbridos nao sao, por si so, capazes degarantir escalabilidadee Qualidade de Experiencia (QoE) sem os mecanismos apropriados. Por exemplo, adisponibilidade de conteudo diminui se osbuffersnos pares forem mal gerenciados. Defato, o gerenciamento efetivo do conteudo armazenado nos pares da rede P2P e necessariouma vez que dados replicados podem dominar a ocupacao dosbuffersdos pares devidoao churn [Melo et al. 2011]. Consequentemente, identificar objetos valiosos e torna-losdisponıveis na rede P2P tende a reduzir a carga de trabalho submetida aos servidores daCDN. O presente trabalho apresenta polıticas para a identificacao de tais objetos.

Neste artigo, quatro polıticas de gerenciamento de objetos sao introduzidas e avali-adas. Essas polıticas usam meta-dados para melhorar a disponibilidade de conteudo emsistemas hıbridos CDN-P2P. Diferente de polıticas ja implementadas, que separam parteda capacidade de armazenamento para manter o historico de acesso aos dados, as polıticaspropostas usam dados disponibilizados pelos provedores de conteudo, atraves de seus sis-temas de recomendacao, para rapidamente identificar padroes de acesso e o valor dosobjetos. Adicionalmente, as polıticas propostas capturam a influencia dos sistemas derecomendacao na popularidade dos objetos distribuıdos pelo sistema CDN-P2P.

A avaliacao das polıticas propostas foi realizada usando dados reais, coletados dosite YouTube, em uma variedade de cenarios de rede com tamanho e dinamica identificadaem sistemas reais de distribuicao de conteudo. Resultados numericos mostram que sob aresponsabilidade das polıticas propostas a disponibilidade de conteudo pode ser melho-rada em alguns casos em mais de 70%, comparada a gerencia realizada com a polıticaLFU (do ingles,Least Frequently Used Policy), e mais que 50% comparada a gerencia re-alizada com a polıtica GDSP (do inglesGreedy-Dual Size Policy), uma polıtica conhecidapor realizar gerenciamento efetivo de conteudo.

O restante deste artigo esta organizado da seguinte forma. Na Secao 2, apresentam-se os trabalhos relacionados. Na Secao 3, apresenta-se o cenario de rede considerado nesteestudo. Na Secao 4, descreve-se a colecao de vıdeo usada nas avaliacoes numericas. NaSecao 5, descrevem-se as polıticas de gerenciamento de objetos. Posteriormente, na Secao6, apresentam-se os resultados numericos coletados nos experimentos de simulacao. Fi-nalmente, na Secao 7, as conclusoes desde trabalho sao apresentadas.

2. Trabalhos Relacionados

Funcoes de custo usadas em polıticas de gerenciamento definem o valor dos objetos emsistemas de distribuicao de conteudo. Essas funcoes sao baseadas em meta-dados dosobjetos, tais como a banda passante requerida e a raridade do objeto. No que segue,apresentam-se trabalhos relacionados nessa linha.

Em [Jin and Bestavros 2000], os autores estendem a estrategiaGreedy-Dual Size,que leva em conta localidade temporal e tamanho do conteudo, pela inclusao de dadoshistoricos de objetos ja removidos da cache. A polıtica GDSP, do inglesPopularity-Aware Dual-size Greedymantem uma fracao da capacidade de armazenamento da cachereservada para guardar informacoes de objetos ja removidos. Em um cenario em queaqueles objetos precisem ser armazenados novamente, evita-se a reconstrucao dos seushistoricos de acesso. Nas polıticas propostas neste artigo, ao inves de se reservar espacona cache para aguardar esses dados, usa-se o site do provedor do conteudo para obter esseshistoricos. Ainda, sinais deixados pelos usuarios, tais como qualificacao e contagem de

VIII Workshop de Redes Dinâmicas e Sistemas P2P 75

Page 3: Polticas de Gerenciamento de Conte´ı udo Gerado por Usu ...classes/coppe-redes-2012/trabalho/WP2P-ST2-3(1… · A sinergia entre redes Par-a-Par(P2P) e Rede de Distribuic¸a˜o

visualizacoes, coletada na rede socialon-line estabelecida em torno do conteudo, saoutilizados para definir as funcoes de custo.

Em [Kulkarni and Devetsikiotis 2010], propoe-se um sistema de cache distribuıdacujo criterio de armazenamento e baseado em metricas de rede sociais coletadas em umarede socialon-line formada em torno do site do YouTube. Tecnicas de redes sociais saousadas para identificar os objetos mais valiosos e a frequencia com que o conteudo precisaser renovado. O presente trabalho estende o trabalho em [Kulkarni and Devetsikiotis 2010]ao usar sinais pessoais, por exemplo qualificacao, coletados na mesma rede social, eaplica-los no contexto de um sistema CDN-P2P.

Em [Cheng and Liu 2009], usa-se o sistema de recomendacao do YouTube paradesenvolver um esquema de antecipacao de acesso para um sistema P2P de distribuicaode vıdeo em um cenario de redes moveis. O objetivo principal e a reducao do atraso,uma vez que se este for demasiadamente longo o compartilhamento de conteudo en-tre as aplicacoes rodando no sistema pode ser inviabilizado. Diferente do trabalho de[Cheng and Liu 2009], o presente artigo introduz polıticas que gerenciam os vıdeos empares que formam um sistema de distribuicao de conteudo hibrıdo CDN-P2P.

O presente artigo estende a pesquisa em [Melo et al. 2012] aoi) definir e avaliaruma nova polıtica adaptativa de gerenciamento de conteudo, chamada de GDSA, do inglesGreedy Dual-Size Adaptative; ii) avaliar o desempenho das polıticas propostas utilizandoo modelo dechurn “cauda longa”; eiii) apresentar uma formulacao matematica para oproblema da distribuicao de conteudo em sistemas CDN-P2P. Os estudos de avaliacaoapresentados neste artigo mostram que a nova polıtica definida apresenta melhor desem-penho que as polıticas definidas previamente.

3. O Sistema de Distribuicao Orientado ao Conteudo

O sistema de distribuicao de conteudo, considerado neste estudo, e um hıbrido CDN-P2P e distribui vıdeos de curta duracao. Nesse sistema, os pares apoiam os servidoresda CDN atendendo parte das requisicoes dirigida a estes servidores. Os pares estaoagrupados em comunidades definidas a partir do interesse em um determinado assunto,tais como musica, esporte e entretenimento (ver Figura 1). Apoiado no senso de lo-calidade, as buscas por conteudo sao realizadas somente dentro das comunidades. Em[Crespo and Garcia-Molina 2005], uma ideia similar foi proposta para compartilhamentode musicas tendo-se construıdo a rede P2P a partir de generos musicais. Alem disso,operacoes de busca sao limitadas a membros da comunidade e pares podem tomar parteem varias comunidades.

O papel da porcao P2P, nesse sistema, e impactado pelochurn[Melo et al. 2011].Para modelar ochurn, processos renovaveis independentesZ(.) foram utilizados na cara-cterizacao da dinamica entrada e saida de cada par no sistema[Yao et al. 2006]. Nessemodelo, o inıcio das sessoes de Conexao (UP) e Desconexao (DOWN) e definido, re-spectivamente, por eventos de entrada e saida, e as duracoes das sessoes UP e DOWNsao extraıdas de variaveis randomicas. De fato, definem-se os modelos dechurnCaudaLonga e Cauda Curta, que combinam e configuram as distribuicoes exponencial e paretona modelagem da duracao das sessoes UP e DOWN. Nos estudos numericos realizados,as sessoes de UP e DOWN tem duracoes medias iguais a 15 minutos e 24 horas, respec-tivamente, que sao duracoes tıpicas de sessoes de acesso ao YouTube [YouTube 2012].

76 Anais

Page 4: Polticas de Gerenciamento de Conte´ı udo Gerado por Usu ...classes/coppe-redes-2012/trabalho/WP2P-ST2-3(1… · A sinergia entre redes Par-a-Par(P2P) e Rede de Distribuic¸a˜o

Para o modelo dechurn de Cauda Curta, a duracao da sessao UP e definida poruma distribuicao Exponencial, enquanto a duracao da sessao DOWN e definida peladistribuicao Pareto. Para a distribuicao Exponencial, a probabilidade de escolha de valo-res maiores que o valor esperado desaparece apos o minuto 120. Entretanto, para adistribuicao pareto, essa probabilidade continua a existir em escalas de tempo longas. Ocomportamento dos pares expresso nesse modelo dechurnpode ser descrito da seguinteforma: pares irao permanecer conectados por perıodos curtos que serao seguidos porperıodos longos de desconexao.

Para o modelo dechurn Cauda Longa, a duracao das sessoes UP e DOWN saodefinidas por distribuicoes Pareto. Neste modelo dechurn os perıodos de conexao edesconexao tem uma convergencia mais lenta para os valores medios esperados, i.e 15minutos e 24 horas, tendo-se verificado um aumento no numero de pares ativos no sis-tema [Melo et al. 2011]. O comportamento dos pares expresso nesse modelo dechurnpode ser descrito da seguinte forma: os pares apresentam perıodos longos de conexao edesconexao.

A seguir, descreve-se a modelagem do problema de distribuicao de vıdeos de curtaduracao em um sistema CDN-P2P, no qual as requisicoes de conteudo tem a seguintedinamica: um par realiza requisicao para assistir a um vıdeo (passo 1). O servidor porsua vez analisa se os pares da porcao P2P possuem o vıdeo requisitado, caso positivo, edevolvida uma lista de pares que possuem tal vıdeo (passo 2). O par requisitante esta-belece conexao com os pares dessa lista e comeca a receber o fluxo de vıdeo (passo 3). Seo vıdeo requisitado nao puder ser servido pelos pares, ou por ser inedito ou por algumafalha no sistema, a requisicao do vıdeo e atendida pela CDN (passo 4).

SejaS uma colecao deM vıdeos armazenada nos servidores da CDN. Cada vıdeoi (i = 1, . . . ,M) da colecaoS possui tamanhosi e valorki que indica a importanciado objeto. A porcao P2P do sistema que apoia a distribuicao da colecaoS pela CDNpossuiN pares, cada um com capacidadecj . A variavel binariaxij , (i = 1, . . . ,M ; j =1, . . . , N), sera igual a 1(um) se o vıdeoi estiver armazenado no parj, e sera igual a zerocaso contrario.

Nesse cenario, deseja-se minimizar a carga de trabalho imposta a infraestruturade servidores, na forma de requisicoes realizadas aos vıdeos. Em outras palavras, deseja-se maximizar o conteudo popular, definido pelo valor dos objetoski, na porcao P2P dosistema, e dessa forma reduzir a um numero mınimo as requisicoes atendidas diretamente

ESPORTE

FacaVoceMesmo

MUSICA

ENTRETENIMENTO

REDE DEDISTRIBUICAO

CONTEUDO

High

Disk

Speed

High

Disk

Speed

High

Disk

Speed

High

Disk

Speed

High

Disk

Speed

High

Disk

Speed

(a) A Arquitetura

CDN P2P

P2P

S

PopularidadeTamanhoLinha de tempoCusto de buscaAvaliaçãoRelacionamentos ...

Característicasdos vídeos

t

1 1

2

3

2

3

...

...M

k i

C

NVídeos

Pares

Pares eVídeos

(b) O problema

Figura 1. Distribuic ao de objetos UGC em um Sistema CDN-P2P

VIII Workshop de Redes Dinâmicas e Sistemas P2P 77

Page 5: Polticas de Gerenciamento de Conte´ı udo Gerado por Usu ...classes/coppe-redes-2012/trabalho/WP2P-ST2-3(1… · A sinergia entre redes Par-a-Par(P2P) e Rede de Distribuic¸a˜o

pelos servidores (Passo 4). A seguinte formulacao expressa esse problema:

MaximizarN∑

j=1

M∑

i=1

kixij

Sujeito a:M∑

i=1

sixij ≤ cj, j = 1, . . . , N

M∑

i=1

xij ≤M, j = 1, . . . , N

N∑

j=1

xij ≤ 1, i = 1, . . . ,M

xij ∈ {0, 1}, i = 1, . . . ,M ; j = 1, . . . , N

A formulacao apresentada caracteriza o problema da mochila multiplas 0-1, des-crito em [Martello and Toth 1990], que nao possui uma solucao otima de tempo polino-mial. A representacao da dinamica dos pares nesta definicao, i.e a conexao e desconexaodos pares, a qualquer instantet, agrega caracterıstica estocastica ao problema, ver Figura1.b, o que o torna pelo menos tao difıcil quanto o problema descrito.

Dado que o problema de gerencia de vıdeo em um sistema CDN-P2P e NP-difıcil,i.e nao se conhece solucao otima de tempo polinomial, as polıticas de gerenciamento detais vıdeos sao heurısticas que buscam solucoes aproximadas para o problema.

4. As Colecoes de Vıdeos do YouTubeNesta secao, apresenta-se a colecao de vıdeos usada na realizacao dos estudos numericos.Os conjuntos de dados sao meta-dados que descrevem vıdeos produzidos pelos usuariosdo YouTube, que por sua vez distribui esse conteudo em larga escala. Essas informacoesforam obtidas usando um coletor que implementa uma busca em largura nas compo-nentes conexas do grafo definido pelo relacionamento entre vıdeos armazenados no sitedo YouTube. As coletas sao iniciadas com um conjunto de vıdeos disponibilizados nosite do YouTube atraves dos seguintesfeeds: Mais Qualificados, Mais Incluıdos entre osFavoritos, Mais Vistos, Mais Populares, Mais Discutidos, e Mais Respondidos. Essesfeedspodem ser filtrados por paıs e pelas categorias associadas aos vıdeos. Sendo o sis-tema de distribuicao de vıdeos considerado neste artigo contextualizado, por localizacao econteudo, coletou-se apenas conteudo oferecido aos brasileiros, nas categorias de: musica,esporte e entretenimento. A Tabela 1 mostra os detalhes da colecao de vıdeos coletada.

Cada vıdeo obtido nosfeeds, chamado de vıdeo semente, e colocado em uma listaque e processada sequencialmente. Para cada vıdeo nessa lista, um conjunto de vıdeosrelacionados e coletado no site do YouTube, e posteriormente adicionado a lista de vıdeospara ser processado no futuro. A colecao de vıdeos do YouTube e explorada em larguraate um certo nıvel ou ate que todos os vıdeos alcancaveis a partir do conjunto de vıdeossemente tenham sido visitados. Esse limite foi definido com base em uma analise previarealizada em amostras das colecoes de vıdeo, i.e. tempo medio de duracao dos vıdeos, ecom base na duracao das sessoes de acesso ao YouTube, que e aproximadamente de 15minutos[YouTube 2012].

78 Anais

Page 6: Polticas de Gerenciamento de Conte´ı udo Gerado por Usu ...classes/coppe-redes-2012/trabalho/WP2P-ST2-3(1… · A sinergia entre redes Par-a-Par(P2P) e Rede de Distribuic¸a˜o

Tabela 1. Estatısticas da Colec ao de Vıdeo

ColetaCategoria data # de vıdeos NıvelEsporte 2011-06-15 223.564 4Musica 2011-07-14 440.584 4Entretenimento 2011-07-11 413.524 4

Estatıstica da Duracao dos Vıdeos (seg.)Desvio Coeficiente de

Media (µ) Padrao (σ) Variacao (σ/µ)Esporte 170,5 129,6 0,76Musica 221,5 85,2 0,38Entretenimento 224,7 182,8 0,81

Os dados em cada colecao foram gerados, na sua maioria, pelosite, tendo-setambem um dado gerado pelos usuarios. Especificamente, para os dados gerados pe-los usuarios, o coletor obteve a qualificacao do vıdeo que e baseada nas avaliacoes dosusuarios. Para os dados gerados pelo site, o coletor obteve o identificador do vıdeo, aduracao, contador de visualizacoes, a data de publicacao, e os 25 primeiros vıdeos rela-cionados.

A modelagem da popularidade de objetos em sistemas de distribuicao de conteudomultimıdia tem recebido certa atencao da comunidade, com esforcos sendo empreendidoprincipalmente para encontrar distribuicoes de probabilidade que modelem propriedadestıpicas da lei-da-potencia [Guo et al. 2008]. Por outro lado, encontrar tais funcoes nao ecerteza de uma modelagem adequada visto que o precedimento de amostragem, em redessociaison-line, pode afetar tais propriedades como mostrado em [Lee et al. 2009].

Na Figura 2 apresenta-se a distribuicao dos acessos realizados aos vıdeos dascolecoes obtidas e o ajuste com a funcao de distribuicao de probabilidade acumulada com-plementar, para as distribuicoes Zipf, Lognormal e Exponencial. Para as tres colecoes,observa-se que o modelo Exponencial e o que menos modela os acessos em cada vıdeo.Segundo a modelagem exponencial, menos que 80% dos vıdeos possuem pelo menosuma visualizacao e nenhum vıdeo chega a possuir 100 acessos, indicando que com essemodelo nao ha predominancia de vıdeos com alta popularidade. Para a distribuicao Zipfobserva-se um ajuste mais aproximado para os vıdeos com alta popularidade, no entantopara os vıdeos com poucos acessos percebe-se que as curvas nao se ajustam com boaaderencia. Para a distribuicao Lognormal ocorre o melhor ajuste, porem percebe-se quecom esse modelo quase 20% dos vıdeos tem probabilidade de possuırem visualizacoesmaior ou igual que a maxima visualizacao apresentada nas colecoes do YouTube.

Em funcao dos resultados apresentados anteriormente e dos estudos de Lee at.al,em [Lee et al. 2009], optou-se pela utilizacao do metodo de geracao de numeros aleatoriosaceitacao-rejeicao, para reproducao do padrao de acesso contido nas colecoes, em detri-mento aos modelos probabilısticos discutidos anteriormente. O metodo aceitacao-rejeicaousa a probabilidade de ocorrencia das observacoes, extraıda da amostra analisada, para ageracao de um fluxo de numeros aleatorios que ira obedecer a distribuicao de probabili-dade contida nas observacoes.

VIII Workshop de Redes Dinâmicas e Sistemas P2P 79

Page 7: Polticas de Gerenciamento de Conte´ı udo Gerado por Usu ...classes/coppe-redes-2012/trabalho/WP2P-ST2-3(1… · A sinergia entre redes Par-a-Par(P2P) e Rede de Distribuic¸a˜o

1 100 10000

0.0

0.2

0.4

0.6

0.8

1.0

x(número de visualizações)

me

ro a

cu

mu

lad

o d

e v

íde

os c

om

>=

x vis

ua

liza

çõ

es

YouTubeZipf(s = 0, 714)Lognormal(µ = 9, 905, σ = 2, 60)Exponencial(λ = 0, 425)

(a) Musica

1 100 10000

0.0

0.2

0.4

0.6

0.8

1.0

x(número de visualizações)N

úm

ero

acu

mu

lad

o d

e v

íde

os c

om

>=

x vis

ua

liza

çõ

es

YouTubeZipf(s = 0, 761)Lognormal(µ = 9, 10, σ = 2, 22)Exponencial(λ = 0.297)

(b) Entretenimento

1 100 10000

0.0

0.2

0.4

0.6

0.8

1.0

x(número de visualizações)

me

ro a

cu

mu

lad

o d

e v

íde

os c

om

>=

x vis

ua

liza

çõ

es

YouTubeZipf(s = 0, 641)Lognormal(µ = 9, 234, σ = 2, 10)Exponencial(λ = 0, 380)

(c) Esporte

Figura 2. Modelagem de Popularidade em Colec oes de Vıdeo

5. Gerenciamento de Objetos baseado em Custo e em Conteudo

Nesta secao, apresentam-se os algoritmos para gerenciamento de objetos armazenadosem um sistema de distribuicao de conteudo multimıdia, que usa uma rede de sobreposicaoP2P na tarefa de distribuicao, ver Secao 3 para maiores detalhes. Os algoritmos propos-tos decidem armazenar ou excluir objetos dos pares usando o valor do objeto calculadopor uma funcao de custo, que usa um mecanismo de envelhecimento similar ao meca-nismo proposto por Jin and Bestavos, [Jin and Bestavros 2000]. A valoracao dos obje-tos e baseada em dados disponibilizados pelo distribuidor do conteudo, e.g qualificacaofornecida pelo usuario e data de publicacao. O Algoritmo 1 descreve a dinamica geral dapolıtica e os fatores de custoFi sao apresentados nas subsecoes seguintes.

Algoritmo 1 : Gerenciamento de Objetos baseado em Custo e ConteudoL← 0.0;para cadarequisicao para objetoi faca

sei esta na cacheentaoki ← L+ Fi ∗ ci/si;

senaosesi ≤ cache entao

enquantonao existe espaco suficiente na cache paraj facaL← min[kj |j esta na cache];removej que satisfazkj = L;

fimgravai;ki ← L+ Fi ∗ ci/si;

fimfim

fim

No Algoritmo 1, ci e si definem o custo associado comdownloade o tamanhodo objeto, respectivamente.ci e dependente dos recursos de rede disponıveis para cadausuario e nesse caso assume-se que os usuarios possuem os mesmos recursos.Fi valoraobjetos de acordo com os meta-dados disponibilizados pelos distribuidores de conteudo.

80 Anais

Page 8: Polticas de Gerenciamento de Conte´ı udo Gerado por Usu ...classes/coppe-redes-2012/trabalho/WP2P-ST2-3(1… · A sinergia entre redes Par-a-Par(P2P) e Rede de Distribuic¸a˜o

Para definir o custoki, considera-se os meta-dados disponibilizados pelo siteYouTube. Entre os diversos meta-dados disponibilizados, os custoski definidos nesteartigo, usam: o numero de visualizacoes, a data de publicacao do conteudo e a taxade aprovacao. Os dois primeiros dados sao coletados pelas ferramentas de gerencia dotrafego e o ultimo e gerado pelos usuarios que espontaneamente avaliam o conteudo.Os mecanismos de recomendacao, baseados em tais informacoes, influenciam as esco-lhas dos usuarios [Davidson et al. 2010]. A seguir, apresenta-se os fatoresFi usados paradefinir custoki das polıticas de gerenciamento de conteudo multimıdia.

5.1. O Fator de Custo Baseado em Frequencia de Visualizacoes

Para definir o fator de custo basedo em frequencia de visualizacoes globais, o mecanismoki tem que considerar o numero de visualizacoes, registrado pelo sistema de distribuicaode conteudo em seu nıvel global. Assim, o fatorFi e definido com segue:

Fi =vgi

max0≤j≤N{vgj}(1)

onde a funcaomax(.) determina o maior valor do contador de visualizacoes globais re-gistrado nosN objetos armazenados na cache evgi e o contador de visualizacoes globaisdo objetoi sendo avaliado.

No sistema de distribuicao de vıdeos (Secao 3), os objetos acessados sao manti-dos na comunidade e requisicoes futuras para eles sao contadas somente pelos pares quearmazenam os objetos, i.e. pares da rede P2P. A polıtica de gerenciamento de objetosbaseada nesse fator de custo foi chamada de GDSVF, do inglesGreedy-Dual Size ViewFrequency-based.

5.2. O Fator de Custo baseado em Qualificacao

Aos usuarios do YouTube e permitido qualificar os vıdeos que eles assistem, “gostou”ou “nao gostou”. Essa impressao pessoal e usada para posicionar vıdeos relacionados[Davidson et al. 2010]. Alem disso, usuarios podem acessar os vıdeos mais bem quali-ficados em diferentes escalas de tempo, i.e dia, semana, e mes, durante uma sessao deacesso ao YouTube. Com base na relevancia da qualificacao, define-se o fator de custobaseado em qualificacao global como segue:

Fi =qi

max0≤j≤N{qj}(2)

onde a funcaomax(.) fornece a qualificacao maxima registrada para osN objetos ar-mazenados eqi define a qualificacao do objetoi.

A qualificacao feita pelo usuario e considerada constante durante a simulacao. Emoutras palavras, uma vez que o vıdeo e qualificado globalmente ele ira manter esse valore sera apropriadamente ranqueado pela polıtica. Essa polıtica recebeu o nome de GDSR,do inglesGreedy-Dual Size Rating-based.

5.3. O Fator de Custo baseado na Taxa de Visualizacoes

Esse fator de custo e baseado na idade do vıdeo, i.e. o intervalo de tempo decorrido desdea sua publicacao, e nas visualizacoes registradas neste intervalo. Em [Davidson et al. 2010]

VIII Workshop de Redes Dinâmicas e Sistemas P2P 81

Page 9: Polticas de Gerenciamento de Conte´ı udo Gerado por Usu ...classes/coppe-redes-2012/trabalho/WP2P-ST2-3(1… · A sinergia entre redes Par-a-Par(P2P) e Rede de Distribuic¸a˜o

essas informacoes sao classificadas com sinais de qualidade do vıdeo, e tem sido us-adas pelo sistema de recomendacao do YouTube para medir a probabilidade de tal vıdeode interesse dos usuarios. Vıdeos que sao interessantes tornam-se candidatos a lista devıdeos relacionados de um vıdeo alimentador. Com base na contagem de visualizacoese relevancia da idade para a classificacao, define-se a funcao de custo global baseada emtaxa de visualizacoes, o custoki, comFi sendo igual a

Fi =

vgiti

max0≤j≤N{vgj

tj}

(3)

ondevgiti

e a taxa de acesso do objetoi, considerando a sua idade no sistema, i.e.ti quee calculada a partir da data de publicacao do objeto. A funcaomax(.) determina a maiortaxa de acesso registrada para osN objetos armazenados.

Devido a arquitetura do sistema de distribuicao dos vıdeos, esses sinais de quali-dade do vıdeo sao modificados pela atividade da comunidade. Especificamente, um vıdeotem o seu contador de visualizacoes adicionado e a sua idade atualizada durante a suapermanencia na rede P2P do sistema de distribuicao. Essa polıtica recebeu o nome deGDSVR, do inglesGreedy-Dual Size View Rate-based.

5.4. O Fator de Custo Adaptativo Baseado em Frequencia de Visualizacao

A efetividade de polıticas de gerenciamento de objetos baseadas em sinais de qualidadedo vıdeo depende da convergencia entre os padroes de acesso local, que representa ointeresse de uma comunidade por um conteudo, e o global, que representa o interessegeral pelo conteudo. Em caso de descompasso entre esses padroes, o uso dos sinais dequalidade colhidos a partir do interesse geral podem penalizar objetos, fazendo com que apolıtica de gerenciamento empregada tenha desempenho ruim. Para considerar o possıveldescompasso de interesses, introduziu-se modificacoes na dinamica da polıtica de geren-ciamento de conteudo, Algoritmo 1, de tal forma que essa identifique se os acessos locaise globais convergem ou divergem. Com base nessa identificacao, decide-se se os sinaisglobais de qualidade do vıdeo serao utilizados ou nao na definicao do fator de custoFi

(Algoritmo 2).

A polıtica percebe o contexto em que esta atuando a partir da comparacao reali-zada entre a taxa de sensibilidadets e o limiar maximo de sensibilidadetmax

s . Os vıdeosarmazenados nos pares sao mantidos em listasP de tamanhon, ordenada de forma decres-cente em funcao do valor deFi. Sejavgi=0 o numero de visualizacoes globais do objetoilocalizado na primeira posicao deP . Sejavgi=n o numero de visualizacoes globais do ob-jeto i localizado na ultima posicao deP . Neste cenario, a taxa de sensibilidade calculadapara um pars qualquer e dada por:

ts =# de vezes quevgi=0 < vgi=n

# total de acessos(4)

Na definicao dets, supoem-se que uma maior concentracao de vıdeo com umnumero reduzido de visualizacoes no inıcio da lista indica que padroes de acesso locale global divergem. O limiar maximo de sensibilidadetmax

s define quanto descompasso,entre os padroes de acesso local e global, sera aceito pela polıtica. Dessa forma, quando

82 Anais

Page 10: Polticas de Gerenciamento de Conte´ı udo Gerado por Usu ...classes/coppe-redes-2012/trabalho/WP2P-ST2-3(1… · A sinergia entre redes Par-a-Par(P2P) e Rede de Distribuic¸a˜o

Algoritmo 2 : Algoritmo para CalcularFi

Entrada: (i, L, tmaxs )

Saıda: (Fi)sei for ineditoentao

sets ≥ tmaxs entao

Fi ← L+ cisi

;senao

Fi ← L+ vgi ×cisi

;fim

senaosets ≥ tmax

s entaoFi ← L+ vgi ×

cisi

;senao

Fi ← L+ (vgi + Fi)×cisi

;fim

fim

esse descompasso atinge o valor estabelecido emtmaxs a valoracao dos objetos passa a des-

considerar os sinais globais do objeto. O limiar maximo de sensibilidade e um parametrodependente da carga de trabalho submetida ao sistema. Nos estudos numericos apresen-tados neste artigo, usou-se um limiar maximo de valortmax

s = 0, 5.

Alem de perceber o contexto atraves da taxa de sensibilidade, nessa nova polıticaimplementou-se um mecanismo de bloqueio que impede a substituicao de objetos demaior valor por objetos de menor valor, motivada apenas pelo ineditısmo.

A dinamica dessa polıtica ao manter um fator de sensibilidade para perceber atendencia entre os padroes de acesso faz com que os objetos sejam valorados de acordocom o contexto. Devido a essa caracterıstica, tal polıtica recebeu o nome de GDSA, doinglesGreedy-Dual Size Adaptive.

6. Resultados Numericos

Para avaliar a efetividade das polıticas propostas, experimentos numericos foram conduzi-dos usando a polıtica LFU como o limiar mınimo de desempenho, em termo de taxa deacerto, esperado para o sistema de distribuicao apresentado na Secao 3. O desempenhoda polıtica LRU (do inglesLeast Recently Used Policy), em termos de taxa de acerto,tambem foi avaliado como limiar mınimo de desempenho, mas como seu desempenho foipior que o registrado pela LFU, para todas as cargas de trabalho no cenario de rede con-siderado, tomou-se a LFU como um limiar mınimo neste trabalho. As polıticas propostassao comparadas com a GDSP, que e uma polıtica baseada em custo cujo o desempenhona gerencia de objetos obteve destaque na literatura [Jin and Bestavros 2000].

Para a realizacao dos experimentos numericos, o sistema de distribuicao apresen-tado na Secao 3 foi ajustado para servir vıdeos das seguintes categorias registrados nosite do YouTube: entretenimento, esporte e musica. Esses vıdeos foram coletados deacordo com o procedimento descrito na Secao 4. Uma vez que os vıdeos sementes usa-dos pelo coletor foram obtidos no nıvel paıs da CDN, usada pelo YouTube, considerou-se

VIII Workshop de Redes Dinâmicas e Sistemas P2P 83

Page 11: Polticas de Gerenciamento de Conte´ı udo Gerado por Usu ...classes/coppe-redes-2012/trabalho/WP2P-ST2-3(1… · A sinergia entre redes Par-a-Par(P2P) e Rede de Distribuic¸a˜o

que o padrao de acesso nos vıdeos acessados expressa a preferencia regional dentro dainfraestrutura de distribuicao.

As redes sobrepostas da parte P2P do sistema sao formadas em torno das catego-rias de vıdeos e seus tamanhos variam de400 a 1000 pares, fazendo sua capacidade dearmazenamento variar de3% a 8% de toda demanda de armazenamento da colecao devıdeos. A capacidade de armazenamento de cada par e3600 segundos de vıdeo, o quecorresponde a16 vıdeos para a colecao estudadas.

O desempenho das polıticas propostas foi avaliado utilizando os dois modelos dechurndescritos na Secao 3, cauda curta e cauda longa, em cenarios onde os padroes deacesso local e global convergem e divergem entre si. Esses cenarios foram definidos paraavaliar o desempenho das polıticas que usam os sinais coletados nos nıveis globais paravalorar os objetos, tais como, as baseadas em frequencia de visualizacao (GDSVF) e emtaxa de visualizacao (GDSVR).

A efetividade dessas polıticas e melhor quando os acessos de uma comunidadetendem ao acesso global, caso contrario, tais acessos tem influencia negativa na deter-minacao da importancia de um objeto para a comunidade. Para avaliar o impacto dadivergencia entre os padroes de acesso local e global, utilizou-se o pior caso, no qual osvıdeos das colecoes foram classificados a partir da contagem das visualizacoes em ordemreversa ao padrao de acesso global, i.e., o vıdeo com a menor probabilidade de acessoglobal e o de maior probabilidade de acesso local.

No cenario em que os padroes de acesso local e global convergem (Figura 3),observa-se que as polıticas baseadas em frequencia de visualizacao (GDSVF), em taxa devisualizacao (GDSVR) e adaptativa ao contexto (GDSA) apresentam os melhores desem-penhos para a comunidade esporte, com ganhos respectivos de73, 5%, 72, 8% e 70, 0%para o modelo dechurncauda curta e67, 8%, 67, 3% e 66, 4% para o modelo dechurncauda longa. Essas polıticas mantiveram bom desempenho para as categorias de vıdeosanalisadas. As polıticas baseadas em popularidade (GDSP) e baseada em qualificacao(GDSR) obtiveram melhor desempenho tambem para a comunidade esporte com ganhosrespectivos de50, 3% e46, 9% para o modelo dechurncalda curta e44, 5% e41, 1% parao modelo cauda longa. No entanto, nao apresentaram ganho para a comunidade musica.

Uma vez que todas as polıticas estudadas utilizam o tamanho dos objetos paracompor os seus custo, avaliou-se cada colecao para determinar qual foi o papel da duracaodo vıdeo na valorizacao dos objetos distribuıdos pelas comunidades esporte e musica.Na Secao 4, identificou-se que os vıdeos da categoria musica duram em torno de221, 5segundos e apresentam a variabilidade de tamanho. Em outras palavras, o tamanho doobjeto pode contribuir para a valoracao dos objetos da comunidade esporte, mas temcontribuicao limitada na valoracao de objetos da comunidade musica. A Figura 3.c e aFigura 3.d sugerem essa contribuicao com o desempenho mınimo, i.e., o desempenho dapolıtica LFU e igual ou maior que o desempenho das polıticas GDSP e GDSR.

Como identificado em [Melo et al. 2011], o aumento da capacidade de armazena-mento do sistema, representado pela quantidade de pares, diminui o ganho no desem-penho de uma polıtica. Por isso, o ganho e maior quando o sistema possui400 pares ediminui a medida que se aumenta a quantidade de pares no sistema. Ao comparar o de-sempenho das polıticas para os dois modelos dechurnpercebe-se que o ganho e maior

84 Anais

Page 12: Polticas de Gerenciamento de Conte´ı udo Gerado por Usu ...classes/coppe-redes-2012/trabalho/WP2P-ST2-3(1… · A sinergia entre redes Par-a-Par(P2P) e Rede de Distribuic¸a˜o

400 pares 600 pares 800 pares 1000 pares

Tam. da Comunidade

Gan

ho n

a Ta

xa d

e A

cert

o (%

)

GDSPxLFU

GDSAxLFU

GDSVFxLFU

GDSRxLFU

GDSVRxLFU

110

2030

4050

6070

8090

(a) Esporte: modelo dechurn cauda curta

400 pares 600 pares 800 pares 1000 pares

Tam. da Comunidade

Gan

ho n

a Ta

xa d

e A

cert

o (%

)

GDSPxLFU

GDSAxLFU

GDSVFxLFU

GDSRxLFU

GDSVRxLFU

110

2030

4050

6070

8090

(b) Esporte: modelo dechurn cauda longa

400 pares 600 pares 800 pares 1000 pares

Tam. da Comunidade

Gan

ho n

a Ta

xa d

e A

cert

o (%

)

GDSPxLFU

GDSAxLFU

GDSVFxLFU

GDSRxLFU

GDSVRxLFU

−20

020

4060

8010

0

(c) Musica: modelo dechurn cauda curta

400 pares 600 pares 800 pares 1000 pares

Tam. da Comunidade

Gan

ho n

a Ta

xa d

e A

cert

o (%

)

GDSPxLFU

GDSAxLFU

GDSVFxLFU

GDSRxLFU

GDSVRxLFU

−20

020

4060

8010

0

(d) Musica: modelo dechurn cauda longa

Figura 3. Ganho sobre a polıtica LFU em cen ario convergente dos padr oes de acesso local e global.

para o modelo cauda curta, pois esse modelo mantem menor quantidade de pares ativosque o modelo cauda longa.

A polıtica baseada em qualificacao (GDSR) nao apresentou nenhuma melhoriaem relacao a GDSP para o cenario de convergencia entre os padroes de acesso local eglobal (Figura 3). Isso ocorre pela dificuldade do conteudo em agradar todos os visi-tantes, vıdeos com um grande numero de visualizacoes possuem baixa probabilidadede apresentarem qualificacao maxima. Para as tres colecoes, a maioria dos vıdeos commaxima qualificacao possuem um pequeno numero de visualizacoes e o numero de vıdeoscom muitas visualizacoes e qualificacao maxima e bem pequeno. Como a qualificacaocompoe o custo geral dos objetos na polıtica GDSR, objetos com poucos acessos, poremcom qualificacao maxima, possuem um custo maior, sendo priorizados em se manteremna cache, e assim, impactando negativamente o desempenho dessa polıtica.

Na Figura 4 apresenta-se o desempenho das polıticas de gerenciamento de objetospara o cenario no qual ha divergencia entre os padroes de acesso local e global. Observa-se que as polıticas GDSA, GDSR e GDSP obtiveram os melhores resultados para a co-munidade esporte, com ganhos respectivos de66, 1%, 57, 7% e 57, 1% para o modelo dechurncauda curta e de61, 0%, 50, 2% e49, 8% para o modelo dechurncauda longa. Essaspolıticas tambem mantiveram os melhores ganhos para a comunidade musica. As polıticasbaseadas em frequencia de visualizacao (GDSVF) e taxa de visualizacao (GDSVR) naoapresentaram ganhos em relacao a LFU.

A perda evidente de desempenho das polıticas GDSVF e GDSVR em relacaoa LFU se da em funcao da valoracao dos vıdeos, para essas polıticas, serem baseadosna contagem de visualizacoes globais. Vıdeos com alta probabilidade de acesso localsao menos valorados, visto que esses tem poucas visualizacoes globais. Apesar dessas

VIII Workshop de Redes Dinâmicas e Sistemas P2P 85

Page 13: Polticas de Gerenciamento de Conte´ı udo Gerado por Usu ...classes/coppe-redes-2012/trabalho/WP2P-ST2-3(1… · A sinergia entre redes Par-a-Par(P2P) e Rede de Distribuic¸a˜o

400 pares 600 pares 800 pares 1000 pares

Tam. da Comunidade

Ga

nh

o n

a T

axa

de

Ace

rto

(%

)

GDSPxLFU

GDSAxLFU

GDSVFxLFU

GDSRxLFU

GDSVRxLFU

−1

20

−6

0−

20

20

60

12

0

(a) Entretenimento: modelo dechurn caudacurta

400 pares 600 pares 800 pares 1000 pares

Tam. da Comunidade

Ga

nh

o n

a T

axa

de

Ace

rto

(%

)

GDSPxLFU

GDSAxLFU

GDSVFxLFU

GDSRxLFU

GDSVRxLFU

−1

20

−6

0−

20

20

60

12

0

(b) Entretenimento: modelo dechurn caudalonga

400 pares 600 pares 800 pares 1000 pares

Tam. da Comunidade

Ga

nh

o n

a T

axa

de

Ace

rto

(%

)

GDSPxLFU

GDSAxLFU

GDSVFxLFU

GDSRxLFU

GDSVRxLFU

−1

60

−1

00

−4

02

06

01

20

(c) Musica: modelo dechurn cauda curta

400 pares 600 pares 800 pares 1000 pares

Tam. da Comunidade

Ga

nh

o n

a T

axa

de

Ace

rto

(%

)

GDSPxLFU

GDSAxLFU

GDSVFxLFU

GDSRxLFU

GDSVRxLFU

−1

60

−1

00

−4

00

40

80

12

0

(d) Musica: modelo dechurn cauda longa

Figura 4. Ganho sobre a polıtica LFU em cen ario divergente entre padr oes de acesso local e global.

polıticas agregarem as visualizacoes locais, a partir do segundo acesso ao vıdeo, paracapturar o padrao de acesso local, a renovacao dos objetos com pouca prioridade ocorrecom muita frequencia, dificultando assim, a sensibilidade ao padrao de acesso local.

As polıticas GDSA, GDSR e GDSP tem bom desempenho em relacao a taxa deacerto mınima, tendo a GDSA apresentado o melhor desempenho dentre elas. O mecan-ismo de valoracao da polıtica GDSP captura a tendencia de popularidade no nıvel local,por isso nao sofre impacto das visualizacao globais. A polıtica GDSR aproveita-se do en-gajamento dos membros da comunidade que avaliam os vıdeos de mais importancia paraeles. De fato, no cenario em que a colecao e acessada em ordem inversa, os vıdeos commaior probabilidade de acesso local possuem pouco acesso global, porem sao bem quali-ficados, a maioria com qualificacao maxima. Sugerindo que os membros de pequenascomunidades, i.e., aqueles interessados em conteudos especıficos, investem algum tempoqualificando o conteudo acessado.

O desempenho da polıtica GDSA e devido ao mecanismo que detecta os con-vergencia/divergencia no padroes de acessos local e global. Ao identificar a divergenciaentre os padroes, permite que a polıtica passe a usar somente as visualizacoes locais paravalorar os vıdeos, em detrimento as visualizacoes globais. Essa polıtica ainda usa ummecanismo de bloqueio de vıdeos que impede a entrada de vıdeos, caracterizados comode baixo valor para a comunidade.

7. Conclusoes

Estudos tem demonstrado que a replicacao descontrolada de dados, na porcao P2P de umsistema de distribuicao de conteudo hibrıdo CDN-P2P, devido aochurn, reduz o desem-penho geral desse sistema. Neste artigo, estudou-se a efetividade das polıticas baseadas

86 Anais

Page 14: Polticas de Gerenciamento de Conte´ı udo Gerado por Usu ...classes/coppe-redes-2012/trabalho/WP2P-ST2-3(1… · A sinergia entre redes Par-a-Par(P2P) e Rede de Distribuic¸a˜o

em sinais pessoais deixados por usuarios de redes sociais on-line, como forma de melho-rar a disponibilidade de conteudo em um sistema CDN-P2P. Quatro polıticas de gerenci-amento de objetos foram propostas e avaliadas usando dados reais oriundos das colecoesde vıdeo do YouTube. As polıticas avaliadas melhoraram, em alguns casos, a disponibil-idade de conteudo em mais de 70%, quando comparadas a polıtica LFU, e em mais de50%, quando comparadas a polıtica GDSP.

Referencias

Cheng, X. and Liu, J. (2009). NetTube: Exploring social networks for peer-to-peer shortvideo sharing. InIEEE INFOCOM, pages 1–9.

Crespo, A. and Garcia-Molina, H. (2005). Semantic overlay networks for p2p systems.In Agents and Peer-to-Peer Computing, volume 3601 ofLNCS, pages 1–13.

Davidson, J., Liebald, B., Liu, J., Nandy, P., Van Vleet, T., Gargi, U., Gupta, S., He, Y.,Lambert, M., Livingston, B., and Sampath, D. (2010). The youtube video recommen-dation system. InACM conference on Recommender systems, pages 293–296.

GridNetworks (2012). http://www.gridnetworks.com/.Ultimo Acesso em 01/03/2012.

Guo, L., Tan, E., Chen, S., Xiao, Z., and Zhang, X. (2008). The stretched exponentialdistribution of internet media access patterns. InACM symposium on Principles ofdistributed computing, pages 283–294.

Jin, S. and Bestavros, A. (2000). Popularity-aware greedy dual-size web proxy cachingalgorithms. InIEEE Computer Society, ICDCS 2000, pages 254–261.

Kulkarni, V. and Devetsikiotis, M. (2010). Communication timescales, structure and pop-ularity: Using social network metrics for youtube-like multimedia content distribution.In IEEE ICC 2010, pages 1–5.

Lee, S. H., Kim, P., and Jeong, H. (2009). Statistical properties of sampled networks.Physical Review E, 73. First published ver. in 2005.

Martello, S. and Toth, P. (1990).Knapsack Problems: Algorithms and Computer Imple-mentations. John Wiley & Sons, Chichester, NY, revised edition.

Melo, C. A., Liborio Filho, J. a. d. M., and Fonseca, N. L. S. (2012). Object managementpolicies in P2P-CDN networks. InIEEE ICC, ICC ’2012. To Apper.

Melo, C. A. V., Vieira, D., and Liborio, J. M. (2011). Impact of churn on object manage-ment policies implemented by peer-to-peer assisted content distribution networks. InIEEE Latin-American Conference on Communications, pages 1–6.

Yao, Z., Leonard, D., Wang, X., and Loguinov, D. (2006). Modeling heterogeneoususer churn and local resilience of unstructured p2p networks. InIEEE InternationalConference on Network Protocols, pages 32–41.

Yin, H., Liu, X., Zhan, T., Sekar, V., Qiu, F., Lin, C., Zhang, H., and Li, B. (2009). Designand deployment of a hybrid CDN-P2P system for live video streaming: experienceswith livesky. InACM international conference on Multimedia, MM ’09, pages 25–34.

YouTube (2012). www.youtube.com.Ultimo Acesso, 01/03/2012.

VIII Workshop de Redes Dinâmicas e Sistemas P2P 87