DEEP WEB - A face oculta da internet, o que ela oferece de útil para a área acadêmica.

DEEP WEB - A face oculta da internet, o que ela oferece de

útil para a área acadêmica.

Antonio Alberto Silva Souza1, Álisson Gomes Linhares

1, Francisco Adaias Gomes

da Silva1, Wermyson Fernandes Gonçalves

1

1Instituto Federal de Educação, Ciência e Tecnológia do Ceará (IFCE) – Campus

Canindé – Curso de Tecnologia em Redes de Computadores – Grupo de Pesquisa em

Informática Aplicada

{ albertojjnvu, wermyson.ti}@gmail.com, [email protected],

[email protected]

Abstract. This article aims to show that the Deep Web content exists not only

bad, but there are also interesting academic content such as books, journal

articles, tutorials and more. We will show what is Deep Web and some of its

features, as well as can be accessed and care to access it, and show

primarily as useful information can be obtained showing alternative sources

of research and well as a link that have several books and scientific articles

because Deep Web when used well can become a great resource for

academia.

Resumo. Este artigo tem como objetivo mostrar que na Deep Web não existe

apenas conteúdo ilícito, mas há também materiais úteis para a área

acadêmica, como livros, artigos científicos, tutoriais entre outros. Neste

artigo, mostramos o que é Deep Web e algumas de suas características

principais, como pode ser acessada, cuidados ao acessá-la, apresentando

ferramentas bem como informações úteis que fazem da Deep Web uma fonte

alternativa de pesquisa, e que ao ser bem utilizada, pode ampliar de maneira

positiva as opções de busca do conhecimento na internet, principalmente na

área acadêmica.

1. INTRODUÇÃO

Desde sua criação à sua expansão nas últimas décadas, a internet (rede mundial de

computadores) ainda possui muitas partes inexploradas que contém um grande número

de informações que não podem ser encontradas utilizando buscadores comuns, como o

Google, o Bind e o Yahoo.

Franco (2013) afirma que os buscadores comuns não conseguem ter acesso a

certas informações, pois conseguem apenas indexar 4% das informações

disponibilizadas na internet (web superficial) como um todo, os outros 96% estão

localizados em um repositório de informações chamada de Deep Web (DW) ou Web

profunda.

Apesar de a DW possuir um volume de informações consideravelmente maior

que a web de superfície, ela ainda não se popularizou. Diversos fatores determinam a

não popularização da Deep Web, um deles seria o preconceito ou a má fama dela

possuir apenas conteúdos ilegais, como afirma Landim (2013), “a quem diga que na

Anais do Encontro Regional de Computação e Sistemas de Informação

Manaus, 08 a 10 de maio de 2014 ISSN 2238-5096 (CDR)

Deep Web pode ser encontrado conteúdo *‘macabro’, como pedofilia, canibalismo,

necrofilia, tráfico de drogas, e assassinatos de aluguel”.

Porém, a má fama atribuída à Deep Web provavelmente foi causada por

usuários que, ao perceberem das vantagens dela, como o grande número de

informações e a navegação por um navegador específico que preza o anonimato,

decidiram se aproveitar disso e propagar conteúdos ilícitos. Entretanto, a Deep Web

possui outros benefícios, além do anonimato e da privacidade, nela há conteúdos que

interessam tanto aos usuários comuns quanto aos acadêmicos.

Vemos a necessidade de reverter esse cenário negativo, mostrando que na

Deep Web é possível acessar conteúdos atrativos para a área acadêmica, como livros,

artigos científicos, tutoriais que a web superficial não disponibiliza. Este trabalho tem

o objetivo de mostrar que a Deep Web ainda não é muito conhecida pelos usuários

acadêmicos, e que quando bem utilizada pode trazer uma gama de informações que

pode ser bastante útil para esse público.

2. O QUE É DEEP WEB?

Landim (2013) afirma que o termo Deep Web foi atribuído por Michael K. Bergman,

CEO e cofundador da Structured Dynamics LLC. Ele diz que a Deep Web se refere a todo

aquele conteúdo que não pode ser indexado pelos sites de busca, e, dessa forma, não está

disponível diretamente para quem navega na internet. Ou seja, a Deep Web é uma parte da

internet que está oculta para os motores de busca padrão, e que, para acessá-la, é

preciso utilizar um navegador específico. O fato dos buscadores comuns não

indexarem certas páginas, é que o editor, ao criar um site ou blog, não define as

configurações que fazem, com que sua página, seja indexada ou não pelos motores de

busca.

Para uma melhor compreensão, Bergman (2001) usa uma analogia interessante

para mostrar como seria o sistema de busca da internet. Ele compara os buscadores

comuns a um barco pesqueiro, que ao jogar suas redes de pesca, só conseguem atingir

a superfície do oceano (internet superficial), fazendo, assim, que tenha acesso apenas a

uma parte dos peixes – informações – disponíveis (Figura 1), o restante estaria na

parte mais profunda (Deep Web) e seria preciso barcos pesqueiros mais equipados

para ter acesso às profundezas (Figura 2).

Figura 1. Representação de como funcionam os buscadores comuns. Fonte: Bergman (2001)



Figura 2. Representação das ferramentas de pesquisa para o acesso a Deep Web. Fonte: Bergman (2001)

O principal objetivo da Deep Web é manter o anonimato. Surgiu graças aos

laboratórios de pesquisas da marinha dos EUA, os quais desenvolveram o projeto The

Onion Routing para tratar de propostas de pesquisa, design e análise de sistemas

anônimos de comunicação [FRANCO 2013]. As forças armadas utilizavam esse canal

para se comunicar com mais segurança, pois, uma vez inseridos na rede, os usuários

não são identificados e os dados transmitidos são criptografados.

Para acessar a Deep Web, é preciso de um navegador específico, a principal

forma de acesso utiliza um software denominado TOR (The Onion Routing), criado e

usado, originalmente, apenas pelo governo e o exército americano para acessar e

transmitir os dados nessa rede anônima. Atualmente, na sua segunda versão, a DW

sofreu alterações, pois foi liberado seu uso *não governamental.

Onion, em português, significa cebola. Esse é um termo que retrata bem a

Deep Web, pois, assim como a cebola, ela possui várias camadas [TORPROJECT,

2013]. Entretanto, vale ressaltar, que não se sabe, ao certo, se realmente essas camadas

existem, pois diversos autores consideram que a existência delas é apenas especulação

[FRANCO, 2013].

3. QUAL TIPO DE CONTEÚDO EXISTENTE NA DEEPWEB?

Franco (2013 ) utiliza a cena do filme Matrix (Warner Bros Pictures, 1999) para

realizar uma analogia com duas pílulas, uma representando o mundo online e a outra

o mundo real. O presente artigo utilizará da mesma analogia de forma diferente, as

pílulas representarão os tipos de conteúdos encontrados na Deep Web, ou seja os

lícitos e os ilícitos.

Em uma cena do filme Matrix, Morpheus confronta Neo com duas opções,

representadas por duas pílulas, uma pílula azul e outra vermelha, em que uma das duas

terá que ser escolhida por Neo, e que mudará sua percepção de mundo caso escolha a

errada.

Realizamos a mesma analogia com o conteúdo da Deep Web, assim, o usuário

passaria a ser o papel de Neo na analogia, tendo que escolher uma das opções, ao

escolher a pílula azul, teria o acesso uma rica fonte de pesquisas acadêmicas, contendo

artigos, livros e tutoriais que enriquecem mais ainda seus conhecimentos. E em

paralelo, existe um mundo no qual as pessoas se aproveitam do anonimato para



realizar atividades ilícitas como, cometer crimes virtuais, expor conteúdos ilegais e

pornográficos, representando assim a pílula vermelha.

De maneira alguma, o presente artigo incentiva o usuário a pesquisar

conteúdos indevidos, pelo contrário, vem mostrar que a Deep Web não possui apenas

o lado ilícito, mas também há um lado com excelente conteúdo que deve ser melhor

aproveitado.

4. O QUE A DEEP WEB TEM A OFERECER DE ÚTIL PARA A

ÁREA ACADÊMICA?

Existem algumas empresas e grupos que fazem a “mineração” dos dados da

Deep Web, e disponibilizam ferramentas de busca na própria internet superficial,

como por exemplo, a BrigthPlanet, criada por Mike Bergman, onde em seu site, ele

mostra uma ferramenta de pesquisa que coleta informações e arquivos dos bancos de

dados na Deep Web, e possibilita que os usuários acessem essas informações pela web

convencional.

Existem também outras fontes de pesquisas que são uma ótima alternativa para quem

de fato não deseja acessar diretamente a Deep Web, para não se aventurar nesse

mundo oculto. Franco (2013) cita diversas ferramentas e sites que podem contribuir

para o desenvolvimento acadêmico dos usuários, são elas:

A Complete Planet, desenvolvida pela empresa BrigthPlanet, é uma ferramenta de

buscas para a Deep Web que permite encontrar assuntos de diversas áreas, desde

alimentos e bebidas, assuntos militares e vários artigos científicos. O usuário

também consegue acessá-la pela a web superficial. Mesmo sendo acessada desta

maneira, ela busca as informações em alguns bancos de dados da Deep Web.

Endereço: http://aip.completeplanet.com/

O InfoMine foi construído por bibliotecas Norte Americanas, como: University of

California, Wake Forest University, California State University, University of

Detroit. Ela possui vários tipos de conteúdos, como livros eletrônicos, artigos,

diretórios de pesquisadores, entre outros assuntos. Endereço:

http://infomine.ucr.edu/

O DeepWebTech é uma junção de cinco motores de busca, onde cada um deles

possui um tema específico para alguma área, como medicina, ciências e negócios.

Endereço: http://www.deepwebtech.com/

O Scirus é outro motor de busca, mas totalmente voltado para pesquisa científica,

onde podem ser encontrados jornais, matérias didáticas, patentes e intranets

institucionais. Endereço: http://www.scirus.com/srsapp/

A ferramenta Intute, embora esteja voltada para as universidades mais coneituadas

do Reino Unido, permite em sua navegação a escolha do conteúdo tanto por assunto

quanto por palavras-chave para assuntos acadêmicos, como Agronomia, Medicina,

Engenharia, etc. Endereço: http://www.intute.ac.uk/

A WWW Virtual Library é o mais antigo catálogo Web e foi desenvolvido por

alunos de Tim Berners Lee, o próprio criador da Web. Para utilizá-la, inseri-se o

termo na caixa de pesquisa ou, simplesmente, o usuário escolhe o assunto no menu

vertical. Endereço: http://vlib.org



http://infomine.ucr.edu/

http://vlib.org/

Infoplease é ideal para buscar enciclopédias, almanaques, atlas e biografias em

geral. Endereço: http://www.infoplease.com/index.html

TechXttrra é voltado para a Matemática, Engenharia e Computação, com muitos

dados e relatórios técnicos. Endereço: http://www.techxtra.ac.uk/index.html

O Tor Library é uma página bastante conhecida de compartilhamento de livros, na

qual existe um acervo de aproximadamente 60 Gb de livros, com vários tipos de

conteúdos. Enderço: http://am4wuhz3zifexz5u.onion/

Assim como a Tor Library, ainda existe a Imperial Library onde há vários e-books

divididos por variados assuntos. Endereço: http://xfmro77i3lixucja.onion/

5. COMO ACESSAR A DEEP WEB E CUIDADOS AO ACESSÁ-LA?

Diversos usuários não conhecem a forma de acessar os conteúdos da Deep Web nem

como realizar a navegação nessa rede, o que provavelmente seria um dos pontos a

causar um impacto negativo sobre essa rede, assim foi percebida a necessidade de se

conhecer como funcionam as ferramentas que permitem a navegação na Deep Web.

A primeira e a mais conhecida camada da Deep Web é a Onion, ela possibilita

que os usuários naveguem de forma segura, onde todas as informações trafegadas são

criptografadas. O acesso a essa camada é permitido utilizando o programa TOR, que,

ao executá-lo, o usuário é direcionado a um navegador que lhe permite usufruir do

conteúdo da Deep Web. Os passos seguintes mostram como acontece o acesso à esse

navegador.

Primeiramente, é preciso acessar o site do Tor Project (www.torproject.org) e

procurar a sessão de download (Figura 3), baixar o programa TOR Browser, e por fim

instalá-lo.

Figura 3. Download da ferramenta TOR. Fonte: Santos e Marchi (2013).

O próximo passo seria a execução do mesmo, ao instalar o programa é

mostrado o navegador que o usuário utiliza para acessar a rede TOR. O TOR utiliza o

navegador Firefox modificado exclusivamente para acessar a DW. Quando iniciado, o

software abre o navegador modificado e um painel de controle, ao iniciar a conexão

com o TOR é mostrado para o usuário um IP que ele deve estar usando, onde esse IP é

completamente diferente do padrão de IPs que a Web superficial utiliza (Figura 4).

Após isso, o usuário pode navegar na rede TOR.



http://www.infoplease.com/index.html

http://www.techxtra.ac.uk/index.html

Figura 4: Pagina inicial do Navegador TOR. Fonte: Santos e Marchi (2013).

Geralmente, quando fazemos o acesso a um site na web de superfície, o

servidor desse site identifica o endereço de IP de quem o acessou, mas no TOR isso

não acontece, pois, antes que a requisição chegue ao servidor, ele inícia uma ponte

criptografada (Pereira, 2012), surgindo o anonimato dessa rede, pois a ferramenta

TOR utiliza dessa ponte criptográfica, que consiste em saltar por vários nós da rede

antes de chegar a seu destino, fazendo assim que a identificação do usuário seja oculta.

É preciso ser cauteloso ao acessar a Deep Web, nessa rede impera o

anonimato, muitas pessoas mal intencionadas se utilizam desse artifício para cometer

crimes e expor conteúdo ilícito.

Porém, muitos se enganam ao pensar que estão totalmente anônimos ao

navegar nessa rede, o usuário que navega de forma irresponsável pode de alguma

maneira estar sendo rastreado pelo FBI ou Polícia Federal. Um exemplo disso foi o

caso da prisão de Eric Eoin Marques (considerado pelo FBI um dos maiores

facilitadores de pedofilia do mundo), que foi preso em 2013, quando o FBI explorou

uma vulnerabilidade do Firefox 17.0 para conseguir capturar informações do

criminoso (ROHR, 2013).

Então, cuidado é preciso cuidado ao acessar a DW, é preciso ficar atento, não

clicar em qualquer link, pois muitas vezes ao clicar em algum link indevido o usuário

pode ser redirecionado para alguma página onde não desejaria estar.

Para quem deseja acessar a Deep Web, é aconselhado a utilização e o acesso

por meio de máquinas virtuais, de preferência com sistema operacional Linux,

considerado mais seguro, como afirma Noyes (2013). Ele diz que o OS Linux não é

infalível, mas mostra que uma de suas vantagens básicas reside no modo como os

privilégios de conta são atribuídos, fazendo assim que o mesmo seja preferível para

uma conexão segura à Deep Web. Também é aconselhável utilizar antivírus

atualizados e um firewall eficaz, dificultando assim infestações por vírus e malwares,

que constantemente rodam no ambiente dessa rede.



6. METODOLOGIA

O presente trabalho tem o caráter exploratório, onde foi envolvida uma pesquisa

bibliográfica bem como a abordagem de uma pesquisa realizada em ambiente

acadêmico com 150 entrevistados aplicada durante o mês de fevereiro de 2014. A

pesquisa foi composta por três perguntas, onde a primeira abordava sobre o

conhecimento dos acadêmicos com relação à Deep Web, a segunda pergunta foi

realizada no intuito de se conhecer se o entrevistado já havia acessado a DW, e o

objetivo da terceira foi saber se os entrevistados possuíam algum conhecimento do

tipo de conteúdo existente nssa rede. Após a coleta e verificação dos dados, o presente

trabalho apresenta a seguir o levantamento e a discussão dos resultados obtidos.

7. RESULTADOS E DISCUSSÕES

Na análise do resultado da pesquisa, tendo como base a pergunta: “Você conhece ou já

ouviu falar sobre Deep Web?” (Figura 1), apenas 31% dos entrevistados conheciam a

Deep Web, apesar da pesquisa ter sido realizada em ambiente acadêmico. Visto que a

maioria (69%) não possui conhecimento sobre o assunto DW, os resultados mostram

que mesmo os usuários acadêmicos, que supostamente teriam maior conhecimento

sobre o assunto, estão leigos com relação ao assunto abordado, isso aponta para a

baixa divulgação da Deep Web, bem como a falta de orientações sobre o acesso a esse

ambiente de forma correta e segura.

Figura 4. Percentual de entrevistados que conhecem a Deep Web. Fonte: Autor.

Quando levantado a respectiva pergunta aos entrevistados: “Você já navegou

na Deep Web?”, foi constatado que 89% deles nunca acessaram a Deep Web, devido

ao fato deles não a conhecerem. Porém, realizando a comparação e subtração dos

percentuais dos que conhecem (31%) e da minoria que já navegou (11%), uma parcela

de 20% dos usuários conhecem porém mas nunca navegaram na Deep Web. Desse

grupo que conhece porém nunca navegou nessa rede, pode-se concluir que eles não

acessam a Deep Web pois não sabem como navegar ou até mesmo por receio de

acessar e se deparar com algum conteúdo inapropriado.

Figura 5. Percentual de entrevistados que já acessaram a Deep Web. Fonte: Autor.

31%

69%sim

não



68%

20%

12%NÃO SEI

ILEGAIS

ÚTEIS

Quando perguntado aos entrevistados: “Você sabe qual tipo de conteúdo existe

na Deep Web?”, a maioria dos entrevistados, um total de 68%, afirmaram não

conhecer o conteúdo disponibilizado na Deep Web (Figura 6). Esse percentual pode

ser comprovado e correlacionado no gráfico anterior da Figura 4, que aponta que 69%

dos entrevistados não conheciam a Deep Web, logo esses percentuais se justificam,

pois demonstram, praticamente, os mesmos valores, e identificam que, em ambos, não

os usuários não sabiam o tipo de conteúdo que lá existe. Do restante, 20% dizem que

na Deep Web há conteúdos ilegais, e apenas 12% reconhecem que nela existem

conteúdos úteis, comprovando a má fama difundida sobre a Deep Web.

Figura 5. Resposta dos entrevistados para o tipo de conteúdo da Deep Web. Fonte: Autor.

8. CONCLUSÃO

O presente trabalho envolveu um levantamento bibliográfico bem como uma pesquisa

com parte do corpo acadêmico do IFCE. A pesquisa buscou como fundamentação o

conhecimento dos entrevistados sobre o assunto Deep Web, o principal ponto que

motivou a realização deste trabalho, pois, após a realização da pesquisa, foi

identificado o pouco conhecimento sobre o respectivo assunto, bem como poderia ser

acessada ou tipo de conteúdo existente nela.

Também foi apresentado alguns motores de busca e ferramentas que permitem

o acesso diretamente ao conteúdo da Deep Web, porém esses buscadores citados

possibilitam a busca através da Web convencional, isso permite aos usuários se

prevenir dos risco de acessar alguma página indesejada.

Oliveira e Trevisan (2013) apresentam que "o conceito de liberdade sempre

esteve ligado à ideia do livre-arbítrio, ou seja, o poder de decidir sobre o próprio

destino", levando em consideração o que explicam sobre liberdade, o usuário dever

estar ciente de suas escolhas, e que sempre precisa tomar decisões. Tendo como base

destas informações, o artigo mostrou que apesar da Deep Web ser um ambiente em

que existem conteúdos ilegais, ao ser bem utilizada, podem ser encontrados conteúdos

interessantes para a formação acadêmica.

9. REFERÊNCIAS

Bergman K. B. The Deep Web: Surfacing Hidden Value, BrightPlanet – Deep Content,

24 Setembro 2001.



Karasinski, L. 2013, “Muito além da Deep Web: o que é a Mariana's Web?”,

http://www.tecmundo.com.br/internet/43025-muito-alem-da-deep-web-o-que-e-a-

mariana-s-web-.htm, fevereiro 2014.

Landim, W. 2011, ”Deep Web: o lado obscuro da internet”,

http://www.tecmundo.com.br/internet/15619-deep-web-o-lado-obscuro-da-

internet.htm , fevereiro 2014.

Mello, J. 2012, “Nem tudo são trevas: o lado bom da Deep Web”,

http://revistagalileu.globo.com/Revista/Common/0%2c%2cEMI331438-17770%2c00-

NEM+TUDO+SAO+TREVAS+O+LADO+BOM+DA+DEEP+WEB.html, fevereiro

2014.

NOYES, Katherine 2013, ”Qual sistema é mais seguro, Linux ou Windows?”,

http://idgnow.com.br/ti-corporativa/2010/08/06/qual-sistema-e-mais-seguro-linux-ou-

windows/#&panel2;-1, fevereiro. 2014.

Oliveira, M. Trevisan, R. 2013. “Liberdade é respeitar as próprias escolhas e o limite dos

outros”,http://mulher.uol.com.br/comportamento/noticias/redacao/2013/05/13/liberdad

e-e-respeitar-as-proprias-escolhas-e-o-limite-dos-outros.htm, fevereiro 2014.

Pereira, L. 2012, “Deep Web: saiba o que acontece na parte obscura da internet”,

http://olhardigital.uol.com.br/noticia/deep-web-saiba-o-que-acontece-na-parte-

obscura-da-internet/31120, fevereiro 2014.

Rohr, A. 2013, “FBI prende operador de serviços ocultos na rede anônima Tor”,

http://g1.globo.com/tecnologia/noticia/2013/08/fbi-prende-operador-de-servicos-

ocultos-na-rede-anonima-tor.html, fevereiro 2014.

Santos, Carlos Henrique Aguiar dos; Marchi, Késsia Rita da Costa, “O Que a Deep Web

Pode Oferecer Além da Surface Web”. In: SEINPAR - Semana de Informática e XII

Mostra de Trabalhos de Iniciação Científica de Paranavaí, 15., 2013, Paranavaí. Anais

Paranavaí: Unipar, 2013. p. 1 - 5, http://web.unipar.br/~seinpar/2013/artigos/Carlos

Henrique Aguiar dos Santos.pdf>, fevereiro 2014.



http://web.unipar.br/~seinpar/2013/artigos/Carlos

DEEP WEB - A face oculta da internet, o que ela oferece de útil para a área acadêmica.

Documents

Transcript of DEEP WEB - A face oculta da internet, o que ela oferece de útil para a área acadêmica.