Roubo, rapto e violação de autoria: a linguística...

24
Roubo, rapto e violação de autoria: a linguística forense na detecção do crime de plágio Rui Sousa Silva [email protected] Escola de Verão – CLUP 3 de Julho de 2009

Transcript of Roubo, rapto e violação de autoria: a linguística...

Roubo, rapto e violação de autoria: a linguística forense na detecção do crime de plágio

Rui Sousa Silva [email protected]

Escola de Verão – CLUP 3 de Julho de 2009

Água mole em pedra dura…

  Idiossincrasias na linguagem   Sociolecto/Idiolecto   Perfis de personalidade vs. Perfis linguísticos   Intuição vs. estudos empíricos   Lofoscopia linguística – ou como lidar com o

trauma de ter a casa assaltada…   Autoria

A propriedade das palavras

  Grécia Antiga: autoria, autoridade das fontes e credibilidade

  Filosofia humanista do Renascimento: conceitos modernos de indivíduo, de autoria e de autor individual

  Século XV: invenção da imprensa, atribuída a Gutenberg, e os cânones textuais tradicionais

  Impressão em série e cariz económico

A propriedade das palavras

  Séc. XVI: desenvolvimento da escrita enquanto profissão / declínio do patronato na literatura

  Questões económicas: papel preponderante na escrita, aumento das preocupações com o usufruto e cópia

  Roubo da “palavra escrita”

A propriedade das palavras

  1624: Bispo Richard Montagu e a metáfora da palavra “plágio”

  Latim plagiarius (“raptor”) + Grego plagion (“rapto”) num contexto literário

  Palavras começam a ser vistas como propriedade

  Séc. XVIII, UK: 1.ª legislação para gerir casos de plágio e violação dos direitos de autor

A propriedade das palavras

  Escritores e editores: usufruto de direitos legais sobre os seus textos

  Neoclassicismo: reconsidera conceito imitação   Novo destaque à originalidade na escrita   Séc. XVIII: e.g. Alexander Pope e Samuel

Johnson: alerta para casos de plágio   Conceito de propriedade de bens considerados

morais – não materiais

A propriedade das palavras

  Nível mundial: criação + regulamentação de normas e acordos internacionais de direitos de autor (e.g., Convenção de Berna)

  Protecção direitos autor – nacional e países signatários da Convenção

  Plágio vs. Direito de Autor   Questionar propriedade de bem comum,

socialmente partilhável e partilhado: palavras…

A propriedade das palavras

  …e originalidade   Confusão frequente com estilo, na literatura   Intuição e déjà-vu: mais acentuada quanto mais

marcado (=original) estilo do autor   Aumento drástico do volume de produção

literária   Mais difícil garantir consagração do direito de

autoria individual

(Des)Ajuda dos recursos informáticos

  Informática   Ajuda a plagiar   Ajuda a captar plagiadores

  Capacidades da Internet   Recursos utilizados pelos estudantes   Muito trabalho, rapidamente   Plágio

Definições de plágio

  Divulgação de conteúdos sem indicação clara do autor original com intuito de assumir a autoria (Sérgio Nunes)

  Divulgação de conteúdos sem indicação clara do autor original com intuito de assumir a autoria (Sérgio Nunes)

Definições de plágio

  Roubo de produto intelectual. Quem comete o plágio apresenta como sendo seu o texto ou as ideias de outrém, não dá os créditos ao autor original (Françoise Bacquelaine)

  Roubo de produto intelectual. Quem comete o plágio apresenta como sendo seu o texto ou as ideias de outrém, não dá os créditos ao autor original (Françoise Bacquelaine)

Definições de plágio

  Utilização abusiva de palavras e ideias pertencentes a outros, concretizando-se na cópia parcial ou integral das mesmas por parte daquele(s) que as tomam como suas (Raquel Cabral)

  Utilização abusiva de palavras e ideias pertencentes a outros, concretizando-se na cópia parcial ou integral das mesmas por parte daquele(s) que as tomam como suas (Raquel Cabral)

Definições de plágio

  Processo de criação simulada de um texto, por execução de operações mínimas de edição sobre um texto já existente; b) atribuição da autoria ao produtor de um texto criado por edição mínima de um texto existente, sem que este seja acompanhado da referência ao texto editado. (Félix)

  Processo de criação simulada de um texto, por execução de operações mínimas de edição sobre um texto já existente; b) atribuição da autoria ao produtor de um texto criado por edição mínima de um texto existente, sem que este seja acompanhado da referência ao texto editado. (Félix)

Definições de plágio

  Utilização total ou parcial de uma obra intelectual (texto, som, video, imagem, etc) sem a autorização do autor. (Paulo Santos)

  Utilização total ou parcial de uma obra intelectual (texto, som, video, imagem, etc) sem a autorização do autor. (Paulo Santos)

Definição de Plágio

Plágio é, por conseguinte, apresentar intencionalmente as ideias, o trabalho e as

palavras de outrém sem uma atribuição adequada, clara e desambígua.

(2009, prelo)

Plágios - exercícios

  Um abstract de 250 palavras construído a partir de excertos retirados da Internet, sobre um tema do vosso interesse. Aquilo que peço é que retirem excertos entre 80 e 100 palavras da Internet, os “colem” para construir um texto e façam um mínimo de correcções.

Plágios - António Paulo Santos

  In this paper I present the advantages of making corpora available on the World Wide Web, proposing that a resource network of Portuguese corpora is established. First, I discuss the advantages of having and making text corpora available, both for corpus providers and for corpus users and, more generally, for anyone interested in studying language and/or working with natural language processing. I then proceed to suggest some reasons why so far there are so few corpora of Portuguese generally available, describing legal and economic problems, technical difficulties, and cultural impedments. With reference to my previous work with the Oslo Corpus of Bosnian Texts as an example, I list the advantages of making corpora available, from three perspectives: general properties of WWW-based systems, specific advantages for corpus compilers, and for corpus users. Finally, I suggest that Evaluation Contests for Portuguese, based on available corpus data, are organized. http://www.linguateca.pt/Diana/download/abs_WLC.html In this last subsection, by far the largest, we discuss linguistic expressiveness, query power, result presentation, structure encoding, punctuation handling, as well as features existing only in one of the systems, such as the graphical interface for creating disambiguating grammars of INTEX, and the invocation of external programs as virtual attributes of the IMS-CWB. We conclude pointing out the different underlying philosophies of the two systems, as well as stating that many of each systems capabilties were not even mentioned, let alone discussed, for lack of space. http://www.linguateca.pt/Diana/download/abs_propor99.html

Plágios - Sérgio Nunes

  A Recuperação de Informação tem por objectivo obter automaticamente respostas a perguntas sobre grandes colecções de documentos. As respostas podem tomar formas diversas, de listas de documentos a sumários dos mesmos, de elementos em documentos XML a entidades existentes nos documentos. Nalgumas áreas da recuperação de informação existem já ferramentas cujo uso se generalizou e que são a base do acesso à informação em linha; é o caso dos motores de busca na web. http://www.fe.up.pt/si/disciplinas_geral.formview?p_cad_codigo=PRODEI025&p_ano_lectivo=2008/2009&p_periodo=2S O grande volume de informação produzidos pelas várias organizações e pelas pessoas individualmente, já não se compadece com os arquivos tradicionais em papel, quer pelo seu volume quer pelo tempo necessário para localizar e aceder. É muito mais atractivo armazenar e aceder a informação em suporte digital. A maior parte de informação que se produz todos os dias é disponibilizada em formato não estruturado ou semi-estruturado, que não se compadece com as Bases de Dados convencionais: texto, imagens video, som e documentos multimedia. Isto faz com que esteja cada vez mais na ordem do dia as tecnologias de pesquisa de armazenamento de informação que até aqui estavam limitadas a uma utilização mais especializada.

  http://marco.uminho.pt/~macedo/mir/index.html

Plágios – Félix do Carmo

  Os partidos de esquerda conseguiram 23% dos votos, quase um em cada quatro. Não há nenhum país da União Europeia onde a esquerda “radical” tenha alcançado resultados tão claros. Isto só pode ser explicado pela percepção que o eleitorado tem de que, por cá, ao contrário do que acontece no resto da Europa, a social-democracia desapareceu dos partidos de governo, que têm preferido colar-se aos interesses corporativos. Parece haver cada vez mais portugueses a perceber que não há qualquer diferença em votar PS ou PSD. Óptimo. Outro dado curioso é a assombrosa quantidade de idiotas que, em 13 partidos não conseguiu encontrar nenhum que lhe agrade. 236 000 pessoas votaram branco ou nulo. Sentirão talvez a falta de um Partido da Santola, de um Partido CR7 ou de um Partido do Benfica? Inaceitável. O terceiro facto relevante é o elevado número de abstencionistas, que representa um indício claro de que o eleitorado não acredita na sua capacidade de influenciar o rumo político da UE. Se quem decide tudo são os boys da comissão europeia, para quê dar-se ao trabalho de brincar às eleições como se houvesse democracia? Os líderes políticos europeus vão continuar a fazer de conta que é normal uma participação eleitoral de 40% e que a abstenção de 60% não significa nada. Ilações, não vão tirar nenhumas. Incompreensível. http://eumeswill.wordpress.com/2009/06/08/rescaldo/

Plágios – Félix do Carmo

  Os partidos de esquerda-esquerda (CDU, BE, PCTP, POUS) conseguiram 23% dos votos, quase um em cada quatro. Não há mais nenhum país da União Europeia onde a esquerda dita “radical” tenha alcançado resultados tão expressivos. O que só se explica pela percepção que o eleitorado tem de que por cá, ao contrário do que acontece no norte da Europa, a social-democracia desapareceu há muito do horizonte ideológico dos partidos ditos de governo, que têm preferido colar-se à gamela dos interesses corporativos. Parece haver cada vez mais portugueses, portanto, a perceber que votar PS ou PSD é praticamente o mesmo. Óptimo. Outro dado curioso é a assombrosa quantidade de idiotas que, em 13 partidos – com um leque de opções que vai da extrema-esquerda à extrema direita, passando pelos monárquicos – não conseguiu encontrar nenhum que lhe agrade. 236 000 pessoas foram às urnas para votar branco ou nulo. Sentirão talvez a falta de um Partido da Santola, de um Partido CR7 ou de um Partido do Benfica? Incompreensível. O terceiro facto relevante é, obviamente, o elevado número de abstencionistas. Um indício claro de que o eleitorado não acredita na sua capacidade de influenciar o rumo político da UE. Se quem decide tudo são os boys da comissão europeia e quejandos, nos seus gabinetes à prova de som, para quê dar-se ao trabalho de brincar às eleições como se houvesse democracia nisso? Os líderes políticos europeus vão continuar a fazer de conta, claro, que é normal uma participação eleitoral de 40 % e que a abstenção dos restantes 60 % não significa nada. Ilações, não vão tirar nenhumas. Pulhas. http://eumeswill.wordpress.com/2009/06/08/rescaldo/

Selecção dos abstracts

  O Sérgio e o Paulo:   provavelmente não seriam seleccionados, com

acusação de plágio   Ficariam com oom o nome “manchado” como

cientistas   IEEE: não poderiam publicar durante anos

  Félix: O abstract passaria por original, lógico e pertinente… É menos plágio?

Selecção dos abstracts

  Não é original; tão plágio como os restantes   Intercala/corta as frases com ligeiras alterações

– dificuldade de detecção por sistemas de plágio actuais (baseados em strings com um mínino de palavras coincidentes)

  Fraqueza: riqueza lexical

Contribuição da Ling. Computacional

  Agilizar sistemas de pesquisa em rede   Análise estatística de dados significativos como

riqueza lexical   Consideração de aspectos de tradução:

recursos como Metra, Google Translate…   Integração com recursos como o ParaMT

Roubo, rapto e violação de autoria: a linguística forense na detecção do crime de plágio

Rui Sousa Silva [email protected]

Escola de Verão – CLUP 3 de Julho de 2009