DEEP WEB - A face oculta da internet, o que ela oferece de útil para a área acadêmica.
-
Upload
leo-ferreira -
Category
Documents
-
view
228 -
download
0
description
Transcript of DEEP WEB - A face oculta da internet, o que ela oferece de útil para a área acadêmica.
DEEP WEB - A face oculta da internet, o que ela oferece de
útil para a área acadêmica.
Antonio Alberto Silva Souza1, Álisson Gomes Linhares
1, Francisco Adaias Gomes
da Silva1, Wermyson Fernandes Gonçalves
1
1Instituto Federal de Educação, Ciência e Tecnológia do Ceará (IFCE) – Campus
Canindé – Curso de Tecnologia em Redes de Computadores – Grupo de Pesquisa em
Informática Aplicada
{ albertojjnvu, wermyson.ti}@gmail.com, [email protected],
Abstract. This article aims to show that the Deep Web content exists not only
bad, but there are also interesting academic content such as books, journal
articles, tutorials and more. We will show what is Deep Web and some of its
features, as well as can be accessed and care to access it, and show
primarily as useful information can be obtained showing alternative sources
of research and well as a link that have several books and scientific articles
because Deep Web when used well can become a great resource for
academia.
Resumo. Este artigo tem como objetivo mostrar que na Deep Web não existe
apenas conteúdo ilícito, mas há também materiais úteis para a área
acadêmica, como livros, artigos científicos, tutoriais entre outros. Neste
artigo, mostramos o que é Deep Web e algumas de suas características
principais, como pode ser acessada, cuidados ao acessá-la, apresentando
ferramentas bem como informações úteis que fazem da Deep Web uma fonte
alternativa de pesquisa, e que ao ser bem utilizada, pode ampliar de maneira
positiva as opções de busca do conhecimento na internet, principalmente na
área acadêmica.
1. INTRODUÇÃO
Desde sua criação à sua expansão nas últimas décadas, a internet (rede mundial de
computadores) ainda possui muitas partes inexploradas que contém um grande número
de informações que não podem ser encontradas utilizando buscadores comuns, como o
Google, o Bind e o Yahoo.
Franco (2013) afirma que os buscadores comuns não conseguem ter acesso a
certas informações, pois conseguem apenas indexar 4% das informações
disponibilizadas na internet (web superficial) como um todo, os outros 96% estão
localizados em um repositório de informações chamada de Deep Web (DW) ou Web
profunda.
Apesar de a DW possuir um volume de informações consideravelmente maior
que a web de superfície, ela ainda não se popularizou. Diversos fatores determinam a
não popularização da Deep Web, um deles seria o preconceito ou a má fama dela
possuir apenas conteúdos ilegais, como afirma Landim (2013), “a quem diga que na
Anais do Encontro Regional de Computação e Sistemas de Informação
Manaus, 08 a 10 de maio de 2014 ISSN 2238-5096 (CDR)
Deep Web pode ser encontrado conteúdo *‘macabro’, como pedofilia, canibalismo,
necrofilia, tráfico de drogas, e assassinatos de aluguel”.
Porém, a má fama atribuída à Deep Web provavelmente foi causada por
usuários que, ao perceberem das vantagens dela, como o grande número de
informações e a navegação por um navegador específico que preza o anonimato,
decidiram se aproveitar disso e propagar conteúdos ilícitos. Entretanto, a Deep Web
possui outros benefícios, além do anonimato e da privacidade, nela há conteúdos que
interessam tanto aos usuários comuns quanto aos acadêmicos.
Vemos a necessidade de reverter esse cenário negativo, mostrando que na
Deep Web é possível acessar conteúdos atrativos para a área acadêmica, como livros,
artigos científicos, tutoriais que a web superficial não disponibiliza. Este trabalho tem
o objetivo de mostrar que a Deep Web ainda não é muito conhecida pelos usuários
acadêmicos, e que quando bem utilizada pode trazer uma gama de informações que
pode ser bastante útil para esse público.
2. O QUE É DEEP WEB?
Landim (2013) afirma que o termo Deep Web foi atribuído por Michael K. Bergman,
CEO e cofundador da Structured Dynamics LLC. Ele diz que a Deep Web se refere a todo
aquele conteúdo que não pode ser indexado pelos sites de busca, e, dessa forma, não está
disponível diretamente para quem navega na internet. Ou seja, a Deep Web é uma parte da
internet que está oculta para os motores de busca padrão, e que, para acessá-la, é
preciso utilizar um navegador específico. O fato dos buscadores comuns não
indexarem certas páginas, é que o editor, ao criar um site ou blog, não define as
configurações que fazem, com que sua página, seja indexada ou não pelos motores de
busca.
Para uma melhor compreensão, Bergman (2001) usa uma analogia interessante
para mostrar como seria o sistema de busca da internet. Ele compara os buscadores
comuns a um barco pesqueiro, que ao jogar suas redes de pesca, só conseguem atingir
a superfície do oceano (internet superficial), fazendo, assim, que tenha acesso apenas a
uma parte dos peixes – informações – disponíveis (Figura 1), o restante estaria na
parte mais profunda (Deep Web) e seria preciso barcos pesqueiros mais equipados
para ter acesso às profundezas (Figura 2).
Figura 1. Representação de como funcionam os buscadores comuns. Fonte: Bergman (2001)
Anais do Encontro Regional de Computação e Sistemas de Informação
Manaus, 08 a 10 de maio de 2014 ISSN 2238-5096 (CDR)
Figura 2. Representação das ferramentas de pesquisa para o acesso a Deep Web. Fonte: Bergman (2001)
O principal objetivo da Deep Web é manter o anonimato. Surgiu graças aos
laboratórios de pesquisas da marinha dos EUA, os quais desenvolveram o projeto The
Onion Routing para tratar de propostas de pesquisa, design e análise de sistemas
anônimos de comunicação [FRANCO 2013]. As forças armadas utilizavam esse canal
para se comunicar com mais segurança, pois, uma vez inseridos na rede, os usuários
não são identificados e os dados transmitidos são criptografados.
Para acessar a Deep Web, é preciso de um navegador específico, a principal
forma de acesso utiliza um software denominado TOR (The Onion Routing), criado e
usado, originalmente, apenas pelo governo e o exército americano para acessar e
transmitir os dados nessa rede anônima. Atualmente, na sua segunda versão, a DW
sofreu alterações, pois foi liberado seu uso *não governamental.
Onion, em português, significa cebola. Esse é um termo que retrata bem a
Deep Web, pois, assim como a cebola, ela possui várias camadas [TORPROJECT,
2013]. Entretanto, vale ressaltar, que não se sabe, ao certo, se realmente essas camadas
existem, pois diversos autores consideram que a existência delas é apenas especulação
[FRANCO, 2013].
3. QUAL TIPO DE CONTEÚDO EXISTENTE NA DEEPWEB?
Franco (2013 ) utiliza a cena do filme Matrix (Warner Bros Pictures, 1999) para
realizar uma analogia com duas pílulas, uma representando o mundo online e a outra
o mundo real. O presente artigo utilizará da mesma analogia de forma diferente, as
pílulas representarão os tipos de conteúdos encontrados na Deep Web, ou seja os
lícitos e os ilícitos.
Em uma cena do filme Matrix, Morpheus confronta Neo com duas opções,
representadas por duas pílulas, uma pílula azul e outra vermelha, em que uma das duas
terá que ser escolhida por Neo, e que mudará sua percepção de mundo caso escolha a
errada.
Realizamos a mesma analogia com o conteúdo da Deep Web, assim, o usuário
passaria a ser o papel de Neo na analogia, tendo que escolher uma das opções, ao
escolher a pílula azul, teria o acesso uma rica fonte de pesquisas acadêmicas, contendo
artigos, livros e tutoriais que enriquecem mais ainda seus conhecimentos. E em
paralelo, existe um mundo no qual as pessoas se aproveitam do anonimato para
Anais do Encontro Regional de Computação e Sistemas de Informação
Manaus, 08 a 10 de maio de 2014 ISSN 2238-5096 (CDR)
realizar atividades ilícitas como, cometer crimes virtuais, expor conteúdos ilegais e
pornográficos, representando assim a pílula vermelha.
De maneira alguma, o presente artigo incentiva o usuário a pesquisar
conteúdos indevidos, pelo contrário, vem mostrar que a Deep Web não possui apenas
o lado ilícito, mas também há um lado com excelente conteúdo que deve ser melhor
aproveitado.
4. O QUE A DEEP WEB TEM A OFERECER DE ÚTIL PARA A
ÁREA ACADÊMICA?
Existem algumas empresas e grupos que fazem a “mineração” dos dados da
Deep Web, e disponibilizam ferramentas de busca na própria internet superficial,
como por exemplo, a BrigthPlanet, criada por Mike Bergman, onde em seu site, ele
mostra uma ferramenta de pesquisa que coleta informações e arquivos dos bancos de
dados na Deep Web, e possibilita que os usuários acessem essas informações pela web
convencional.
Existem também outras fontes de pesquisas que são uma ótima alternativa para quem
de fato não deseja acessar diretamente a Deep Web, para não se aventurar nesse
mundo oculto. Franco (2013) cita diversas ferramentas e sites que podem contribuir
para o desenvolvimento acadêmico dos usuários, são elas:
A Complete Planet, desenvolvida pela empresa BrigthPlanet, é uma ferramenta de
buscas para a Deep Web que permite encontrar assuntos de diversas áreas, desde
alimentos e bebidas, assuntos militares e vários artigos científicos. O usuário
também consegue acessá-la pela a web superficial. Mesmo sendo acessada desta
maneira, ela busca as informações em alguns bancos de dados da Deep Web.
Endereço: http://aip.completeplanet.com/
O InfoMine foi construído por bibliotecas Norte Americanas, como: University of
California, Wake Forest University, California State University, University of
Detroit. Ela possui vários tipos de conteúdos, como livros eletrônicos, artigos,
diretórios de pesquisadores, entre outros assuntos. Endereço:
http://infomine.ucr.edu/
O DeepWebTech é uma junção de cinco motores de busca, onde cada um deles
possui um tema específico para alguma área, como medicina, ciências e negócios.
Endereço: http://www.deepwebtech.com/
O Scirus é outro motor de busca, mas totalmente voltado para pesquisa científica,
onde podem ser encontrados jornais, matérias didáticas, patentes e intranets
institucionais. Endereço: http://www.scirus.com/srsapp/
A ferramenta Intute, embora esteja voltada para as universidades mais coneituadas
do Reino Unido, permite em sua navegação a escolha do conteúdo tanto por assunto
quanto por palavras-chave para assuntos acadêmicos, como Agronomia, Medicina,
Engenharia, etc. Endereço: http://www.intute.ac.uk/
A WWW Virtual Library é o mais antigo catálogo Web e foi desenvolvido por
alunos de Tim Berners Lee, o próprio criador da Web. Para utilizá-la, inseri-se o
termo na caixa de pesquisa ou, simplesmente, o usuário escolhe o assunto no menu
vertical. Endereço: http://vlib.org
Anais do Encontro Regional de Computação e Sistemas de Informação
Manaus, 08 a 10 de maio de 2014 ISSN 2238-5096 (CDR)
Infoplease é ideal para buscar enciclopédias, almanaques, atlas e biografias em
geral. Endereço: http://www.infoplease.com/index.html
TechXttrra é voltado para a Matemática, Engenharia e Computação, com muitos
dados e relatórios técnicos. Endereço: http://www.techxtra.ac.uk/index.html
O Tor Library é uma página bastante conhecida de compartilhamento de livros, na
qual existe um acervo de aproximadamente 60 Gb de livros, com vários tipos de
conteúdos. Enderço: http://am4wuhz3zifexz5u.onion/
Assim como a Tor Library, ainda existe a Imperial Library onde há vários e-books
divididos por variados assuntos. Endereço: http://xfmro77i3lixucja.onion/
5. COMO ACESSAR A DEEP WEB E CUIDADOS AO ACESSÁ-LA?
Diversos usuários não conhecem a forma de acessar os conteúdos da Deep Web nem
como realizar a navegação nessa rede, o que provavelmente seria um dos pontos a
causar um impacto negativo sobre essa rede, assim foi percebida a necessidade de se
conhecer como funcionam as ferramentas que permitem a navegação na Deep Web.
A primeira e a mais conhecida camada da Deep Web é a Onion, ela possibilita
que os usuários naveguem de forma segura, onde todas as informações trafegadas são
criptografadas. O acesso a essa camada é permitido utilizando o programa TOR, que,
ao executá-lo, o usuário é direcionado a um navegador que lhe permite usufruir do
conteúdo da Deep Web. Os passos seguintes mostram como acontece o acesso à esse
navegador.
Primeiramente, é preciso acessar o site do Tor Project (www.torproject.org) e
procurar a sessão de download (Figura 3), baixar o programa TOR Browser, e por fim
instalá-lo.
Figura 3. Download da ferramenta TOR. Fonte: Santos e Marchi (2013).
O próximo passo seria a execução do mesmo, ao instalar o programa é
mostrado o navegador que o usuário utiliza para acessar a rede TOR. O TOR utiliza o
navegador Firefox modificado exclusivamente para acessar a DW. Quando iniciado, o
software abre o navegador modificado e um painel de controle, ao iniciar a conexão
com o TOR é mostrado para o usuário um IP que ele deve estar usando, onde esse IP é
completamente diferente do padrão de IPs que a Web superficial utiliza (Figura 4).
Após isso, o usuário pode navegar na rede TOR.
Anais do Encontro Regional de Computação e Sistemas de Informação
Manaus, 08 a 10 de maio de 2014 ISSN 2238-5096 (CDR)
Figura 4: Pagina inicial do Navegador TOR. Fonte: Santos e Marchi (2013).
Geralmente, quando fazemos o acesso a um site na web de superfície, o
servidor desse site identifica o endereço de IP de quem o acessou, mas no TOR isso
não acontece, pois, antes que a requisição chegue ao servidor, ele inícia uma ponte
criptografada (Pereira, 2012), surgindo o anonimato dessa rede, pois a ferramenta
TOR utiliza dessa ponte criptográfica, que consiste em saltar por vários nós da rede
antes de chegar a seu destino, fazendo assim que a identificação do usuário seja oculta.
É preciso ser cauteloso ao acessar a Deep Web, nessa rede impera o
anonimato, muitas pessoas mal intencionadas se utilizam desse artifício para cometer
crimes e expor conteúdo ilícito.
Porém, muitos se enganam ao pensar que estão totalmente anônimos ao
navegar nessa rede, o usuário que navega de forma irresponsável pode de alguma
maneira estar sendo rastreado pelo FBI ou Polícia Federal. Um exemplo disso foi o
caso da prisão de Eric Eoin Marques (considerado pelo FBI um dos maiores
facilitadores de pedofilia do mundo), que foi preso em 2013, quando o FBI explorou
uma vulnerabilidade do Firefox 17.0 para conseguir capturar informações do
criminoso (ROHR, 2013).
Então, cuidado é preciso cuidado ao acessar a DW, é preciso ficar atento, não
clicar em qualquer link, pois muitas vezes ao clicar em algum link indevido o usuário
pode ser redirecionado para alguma página onde não desejaria estar.
Para quem deseja acessar a Deep Web, é aconselhado a utilização e o acesso
por meio de máquinas virtuais, de preferência com sistema operacional Linux,
considerado mais seguro, como afirma Noyes (2013). Ele diz que o OS Linux não é
infalível, mas mostra que uma de suas vantagens básicas reside no modo como os
privilégios de conta são atribuídos, fazendo assim que o mesmo seja preferível para
uma conexão segura à Deep Web. Também é aconselhável utilizar antivírus
atualizados e um firewall eficaz, dificultando assim infestações por vírus e malwares,
que constantemente rodam no ambiente dessa rede.
Anais do Encontro Regional de Computação e Sistemas de Informação
Manaus, 08 a 10 de maio de 2014 ISSN 2238-5096 (CDR)
6. METODOLOGIA
O presente trabalho tem o caráter exploratório, onde foi envolvida uma pesquisa
bibliográfica bem como a abordagem de uma pesquisa realizada em ambiente
acadêmico com 150 entrevistados aplicada durante o mês de fevereiro de 2014. A
pesquisa foi composta por três perguntas, onde a primeira abordava sobre o
conhecimento dos acadêmicos com relação à Deep Web, a segunda pergunta foi
realizada no intuito de se conhecer se o entrevistado já havia acessado a DW, e o
objetivo da terceira foi saber se os entrevistados possuíam algum conhecimento do
tipo de conteúdo existente nssa rede. Após a coleta e verificação dos dados, o presente
trabalho apresenta a seguir o levantamento e a discussão dos resultados obtidos.
7. RESULTADOS E DISCUSSÕES
Na análise do resultado da pesquisa, tendo como base a pergunta: “Você conhece ou já
ouviu falar sobre Deep Web?” (Figura 1), apenas 31% dos entrevistados conheciam a
Deep Web, apesar da pesquisa ter sido realizada em ambiente acadêmico. Visto que a
maioria (69%) não possui conhecimento sobre o assunto DW, os resultados mostram
que mesmo os usuários acadêmicos, que supostamente teriam maior conhecimento
sobre o assunto, estão leigos com relação ao assunto abordado, isso aponta para a
baixa divulgação da Deep Web, bem como a falta de orientações sobre o acesso a esse
ambiente de forma correta e segura.
Figura 4. Percentual de entrevistados que conhecem a Deep Web. Fonte: Autor.
Quando levantado a respectiva pergunta aos entrevistados: “Você já navegou
na Deep Web?”, foi constatado que 89% deles nunca acessaram a Deep Web, devido
ao fato deles não a conhecerem. Porém, realizando a comparação e subtração dos
percentuais dos que conhecem (31%) e da minoria que já navegou (11%), uma parcela
de 20% dos usuários conhecem porém mas nunca navegaram na Deep Web. Desse
grupo que conhece porém nunca navegou nessa rede, pode-se concluir que eles não
acessam a Deep Web pois não sabem como navegar ou até mesmo por receio de
acessar e se deparar com algum conteúdo inapropriado.
Figura 5. Percentual de entrevistados que já acessaram a Deep Web. Fonte: Autor.
31%
69%sim
não
Anais do Encontro Regional de Computação e Sistemas de Informação
Manaus, 08 a 10 de maio de 2014 ISSN 2238-5096 (CDR)
68%
20%
12%NÃO SEI
ILEGAIS
ÚTEIS
Quando perguntado aos entrevistados: “Você sabe qual tipo de conteúdo existe
na Deep Web?”, a maioria dos entrevistados, um total de 68%, afirmaram não
conhecer o conteúdo disponibilizado na Deep Web (Figura 6). Esse percentual pode
ser comprovado e correlacionado no gráfico anterior da Figura 4, que aponta que 69%
dos entrevistados não conheciam a Deep Web, logo esses percentuais se justificam,
pois demonstram, praticamente, os mesmos valores, e identificam que, em ambos, não
os usuários não sabiam o tipo de conteúdo que lá existe. Do restante, 20% dizem que
na Deep Web há conteúdos ilegais, e apenas 12% reconhecem que nela existem
conteúdos úteis, comprovando a má fama difundida sobre a Deep Web.
Figura 5. Resposta dos entrevistados para o tipo de conteúdo da Deep Web. Fonte: Autor.
8. CONCLUSÃO
O presente trabalho envolveu um levantamento bibliográfico bem como uma pesquisa
com parte do corpo acadêmico do IFCE. A pesquisa buscou como fundamentação o
conhecimento dos entrevistados sobre o assunto Deep Web, o principal ponto que
motivou a realização deste trabalho, pois, após a realização da pesquisa, foi
identificado o pouco conhecimento sobre o respectivo assunto, bem como poderia ser
acessada ou tipo de conteúdo existente nela.
Também foi apresentado alguns motores de busca e ferramentas que permitem
o acesso diretamente ao conteúdo da Deep Web, porém esses buscadores citados
possibilitam a busca através da Web convencional, isso permite aos usuários se
prevenir dos risco de acessar alguma página indesejada.
Oliveira e Trevisan (2013) apresentam que "o conceito de liberdade sempre
esteve ligado à ideia do livre-arbítrio, ou seja, o poder de decidir sobre o próprio
destino", levando em consideração o que explicam sobre liberdade, o usuário dever
estar ciente de suas escolhas, e que sempre precisa tomar decisões. Tendo como base
destas informações, o artigo mostrou que apesar da Deep Web ser um ambiente em
que existem conteúdos ilegais, ao ser bem utilizada, podem ser encontrados conteúdos
interessantes para a formação acadêmica.
9. REFERÊNCIAS
Bergman K. B. The Deep Web: Surfacing Hidden Value, BrightPlanet – Deep Content,
24 Setembro 2001.
Anais do Encontro Regional de Computação e Sistemas de Informação
Manaus, 08 a 10 de maio de 2014 ISSN 2238-5096 (CDR)
Karasinski, L. 2013, “Muito além da Deep Web: o que é a Mariana's Web?”,
http://www.tecmundo.com.br/internet/43025-muito-alem-da-deep-web-o-que-e-a-
mariana-s-web-.htm, fevereiro 2014.
Landim, W. 2011, ”Deep Web: o lado obscuro da internet”,
http://www.tecmundo.com.br/internet/15619-deep-web-o-lado-obscuro-da-
internet.htm , fevereiro 2014.
Mello, J. 2012, “Nem tudo são trevas: o lado bom da Deep Web”,
http://revistagalileu.globo.com/Revista/Common/0%2c%2cEMI331438-17770%2c00-
NEM+TUDO+SAO+TREVAS+O+LADO+BOM+DA+DEEP+WEB.html, fevereiro
2014.
NOYES, Katherine 2013, ”Qual sistema é mais seguro, Linux ou Windows?”,
http://idgnow.com.br/ti-corporativa/2010/08/06/qual-sistema-e-mais-seguro-linux-ou-
windows/#&panel2;-1, fevereiro. 2014.
Oliveira, M. Trevisan, R. 2013. “Liberdade é respeitar as próprias escolhas e o limite dos
outros”,http://mulher.uol.com.br/comportamento/noticias/redacao/2013/05/13/liberdad
e-e-respeitar-as-proprias-escolhas-e-o-limite-dos-outros.htm, fevereiro 2014.
Pereira, L. 2012, “Deep Web: saiba o que acontece na parte obscura da internet”,
http://olhardigital.uol.com.br/noticia/deep-web-saiba-o-que-acontece-na-parte-
obscura-da-internet/31120, fevereiro 2014.
Rohr, A. 2013, “FBI prende operador de serviços ocultos na rede anônima Tor”,
http://g1.globo.com/tecnologia/noticia/2013/08/fbi-prende-operador-de-servicos-
ocultos-na-rede-anonima-tor.html, fevereiro 2014.
Santos, Carlos Henrique Aguiar dos; Marchi, Késsia Rita da Costa, “O Que a Deep Web
Pode Oferecer Além da Surface Web”. In: SEINPAR - Semana de Informática e XII
Mostra de Trabalhos de Iniciação Científica de Paranavaí, 15., 2013, Paranavaí. Anais
Paranavaí: Unipar, 2013. p. 1 - 5, http://web.unipar.br/~seinpar/2013/artigos/Carlos
Henrique Aguiar dos Santos.pdf>, fevereiro 2014.
Anais do Encontro Regional de Computação e Sistemas de Informação
Manaus, 08 a 10 de maio de 2014 ISSN 2238-5096 (CDR)