Prévia do material em texto
Preparatório para Concursos em Biblioteconomia Módulo 11 – Aula 1 Prof. Juliete Calazans Diferenças entre representação temática x representação descritiva: ➢ Representação temática: Trata da representação dos assuntos dos documentos. Linguagens de indexação, manuais de indexação, tabelas de notação e catalogação por assunto. ➢ Representação descritiva: Representa as características específicas dos documentos. Códigos de catalogação. 1. ANÁLISE DOCUMENTÁRIA Os objetivos da análise documentária são: 1. Identificar e localizar qualquer documento; 2. Transformar e reprocessar documentos; e 3. A recuperação documental. INDEXAÇÃO Preparatório para Concursos em Biblioteconomia Módulo 11 – Aula 1 Prof. Juliete Calazans O processo de análise documentária consiste em: fazer uma leitura do texto com a extração dos conceitos e o processo de atinência. E depois a seleção dos termos encontrados no documento. Esse processo de análise documentaria, no Brasil, é regulamentado pela ABNT através da NBR 12676/1992, que propõe métodos para análise de documentos – determinação de seus assuntos e seleção de termos de indexação. Para livros, por exemplo, devem ser analisadas as seguintes partes Documentos impressos Livros: Título, subtítulo, resumo (se houver), sumário, introdução, ilustrações, diagramas, tabelas, palavras em destaque e referências bibliográficas. 2. INDEXAÇÃO – CONCEITO O processo da indexação envolve fases, como análise de assunto, representação desses assuntos por meio de termos, traduzidos posteriormente por uma linguagem controlada, aproximando-se do processo de classificação na medida em que os dois processos tenham como objetivo a recuperação informacional de maneira efetiva e partem da análise temática do documento (CLEVELAND; CLEVELAND, 2001). Esses instrumentos usados para a representação e recuperação da informação são denominadas linguagens de indexação. Segundo Langridge (1969), são os meios através Preparatório para Concursos em Biblioteconomia Módulo 11 – Aula 1 Prof. Juliete Calazans dos quais o indexador traduz a linguagem natural do autor, encontrada no documento, em uma linguagem artificial, distinta da linguagem de busca do usuário no momento da recuperação. Esse processo consiste na tradução dos assuntos do documento, que se encontra em linguagem natural para uma linguagem controlada, através de uma linguagem de indexação, dando origem a pontos de acesso que remetem para o respectivo documento (LANCASTER, 1993). A norma ABNT/12676 (1992), no seu parágrafo 3.4, descreve indexação como o “[...] ato de identificar e descrever o conteúdo de um documento com termos representativos dos seus assuntos e que constituem uma linguagem de indexação.” De acordo com a mesma Norma, entende-se por indexação um processo que consiste na análise conceitual, identificação de assuntos de um documento e a tradução desses assuntos em termos representativos, que podem ou não ser controlados, dependendo da linguagem de indexação que se usa na sua representação. Essa operação tem por fim “(...) disponibilizar, com objetividade, o conteúdo dos documentos, o pensamento dos autores, em uma palavra, abrir caminho para que se venha a obter uma informação de qualidade” (MENDES; SIMÕES, 2002, p. 11). 3. INDEXAÇÃO – ETAPAS DA PRÁTICA A indexação é dividida em duas etapas, a analise conceitual e tradução. 3.1 Análise conceitual Segundo Lancaster (1993), a indexação é um processo subjetivo, pois o mesmo documento poderá ser indexado de modo diferente, seja na situação em que ele é indexado pelo mesmo indexador em momentos diferentes, ou quando é indexado por diferentes indexadores, pois podem divergir na seleção dos conceitos no momento da análise do documento. Com o propósito de contornar essa subjetividade, é importante fazer algumas perguntas ao documento, no momento da análise, tais como: ▪ De que trata este documento? ▪ Por qual motivo ele foi incorporado ao acervo da biblioteca? Preparatório para Concursos em Biblioteconomia Módulo 11 – Aula 1 Prof. Juliete Calazans ▪ Quais aspectos deste documento serão de interesse aos nossos usuários? A análise conceitual busca identificar quais são os principais assuntos do documento que está sendo tratado. A Indexação é uma atividade muito subjetiva. Imaginem 5 indexadores, numa sala, indexando o mesmo livro. Ao se fazerem essas perguntas, vocês acham que todos vão ter a mesma visão? Que vão indexar de forma idêntica? Com certeza não. Um documento pode e vai ser indexado de diferentes formas, pois cada indexador vai ter uma visão diferente. 3.2 Tradução A tradução é a atividade que elabora, a partir da análise conceitual, um conjunto de termos de indexação. São as famosas palavras – chave. É a transformação dos conceitos em frases ou palavras. A tradução pode ser feita de duas formas: 1. Por extração (derivada): Segundo Lancaster (1997, p. 231), “na indexação automática por extração palavras ou expressões que aparecem num texto são extraídas e utilizadas para representar o conteúdo do texto como um todo.” 2. Por Atribuição: termos de outra fonte que não o documento. 3. ANALISE DO DOCUMENTO PARA ATRIBUIÇÃO DE TERMOS Quase em nenhuma oportunidade, o indexador conseguirá ler um texto ou documento completamente. Indica-se a leitura de trechos que têm maior probabilidade de fornecer informações importantes sobre o texto em menor tempo. Lancaster cita essa lista. 1. Título 2. Resumo 3. Sumário 4. Introdução 5. Ilustrações Preparatório para Concursos em Biblioteconomia Módulo 11 – Aula 1 Prof. Juliete Calazans 6. Palavras ou expressões 4. INDEXAÇÃO – PRINCÍPIOS a) Exaustividade; b) Especificidade; c) Revocação; e d) Precisão. 4.1 Exaustividade e especificidade Existem dois fatores que influem diretamente na eficiência de um sistema de recuperação da informação, ligados diretamente a indexação, são eles: a política de indexação e a exatidão da indexação. De acordo com Lancaster há duas dimensões na indexação do documento: exaustividade (refere-se à abrangência), que é a primeira dimensão do documento e a especificidade (refere-se à profundidade), que é a segunda dimensão do documento. A principal decisão política diz a respeito à exaustividade da indexação, o que é relacionado ao número de termos atribuídos em média. Não é recomendado que exista um limite para esses termos, mas, que se estabeleça uma faixa de termos padrão. E temos também o princípio da especificidade, é o mais importante princípio da indexação de assuntos, remontando a Cutter. Este princípio defende que um tópico deve ser indexado sob o termo mais específico que o abranja completamente e se torna muito comum indexadores serem redundantes quando não o seguem. Lancaster usa o exemplo de um artigo sobre o cultivo de laranjas para exemplificar o princípio, o mesmo seria indexado sob o termo LARANJAS e não com um termo mais genérico como FRUTAS ou FRUTAS CÍTRICAS. Incluir esses termos mais abrangentes tornará a tarefa de diferenciar artigos mais genéricos dos mais específicos mais difícil e demorada. Deve se entender que é possível ter especificidade com a combinação de termos, se nenhum termo sozinho possa Preparatório para Concursos em Biblioteconomia Módulo 11 – Aula 1 Prof. Juliete Calazans representar um tópico. Quanto mais exaustiva, maior será a revocação. Ou seja, iremos recuperar uma maior quantidade de itens e a precisão será menor. 4.1.1 Exaustividade – abrangência ➢ Exaustiva: Maior quantidade de termos, maior cobertura, alta revocação, menor precisão, mais cara para ser realizada ➢ Seletiva: Quantidade limitada de termos, Baixa cobertura de assuntos, baixa revocação, maior precisão e mais barata para ser realizada. 4.1.2 Especificidade – profundidade De acordo com Simões (2011),o conceito de especificidade está ligado ao “[...] grau de exatidão com o qual são extraídos os conceitos dos documentos, assim como o grau de exatidão que é usado na representação desses mesmos conceitos” (SIMÕES, 2011, p. 42). 4.2 Revocação e Precisão Lancaster (1993) utiliza o termo revocação para designar a recuperação de documentos úteis, e o termo precisão como uma medida que evita a recuperação de documentos que não são pertinentes às necessidades do usuário. Essas duas medidas, segundo o autor, devem ser utilizadas para expressar os resultados de uma busca e encontram-se intrinsicamente relacionados com os conceitos de exaustividade e especificidade. A revocação é entendida como a medida do sistema de recuperar documentos relevantes, e precisão como à medida que impede a recuperação de documentos considerados não relevantes. Precisão – é a capacidade de evitar documentos inúteis. 4.2.1 Revocação – recall ▪ Relacionado a estratégias de busca e representação dos assuntos. ▪ Diretamente relacionado ao entendimento das necessidades dos usuários, a qualidade da indexação e a representação dos documentos em uma base de dados. 4.2.2 Precisão Preparatório para Concursos em Biblioteconomia Módulo 11 – Aula 1 Prof. Juliete Calazans ▪ Relacionado à cobertura do assunto; ▪ Diretamente relacionado à seleção dos documentos, à qualidade da indexação e a representação dos mesmos. 4.3 Como melhorar a indexação a) Elos; b) Indexação ponderada; c) Subcabeçalhos; d) Indicação de função; e e) Dispositivos de linguagem de indexação. FIQUE ATENTO! Quanto maior a representação de um documento, mais pontos de acesso ele terá. E quantos mais pontos de acesso, significa que houve uma indexação exaustiva. Isso prova uma maior revocação (recuperação de itens) e menor precisão. Não esqueçam! 5. POLÍTICA DE INDEXAÇÃO De acordo com Carneiro (1985) a política de indexação deve servir como um guia para tomada de decisões e considerar os seguintes fatores: características e objetivos da organização, determinantes do tipo de serviço a ser oferecido; identificação dos usuários, para atendimento de suas necessidades de informação e recursos humanos, materiais e financeiros, que delimitam o funcionamento de um sistema de recuperação de informações. Os elementos que constituem a política de indexação: 1. Cobertura temática; Preparatório para Concursos em Biblioteconomia Módulo 11 – Aula 1 Prof. Juliete Calazans 2. Seleção e tipos de documentos; 3. Processos de Indexação: a) Exaustividade b) Especificidade c) Linguagem d) Revocação e precisão do sistema; 4. Estratégia de busca; 5. Tempo de resposta; 6. Forma de saída; e 7. Avaliação do sistema. 6. SISTEMAS PRÉ E PÓS COORDENADOS Para a representação dos assuntos compostos utiliza-se a coordenação, ou seja, a combinação de termos. Para essa combinação de termos temos duas possibilidades, utilizando representações pré ou pós coordenadas. Vamos estudar cada uma delas agora. 6.1 Sistemas pós coordenados ▪ Os termos podem ser combinados entre si; ▪ Preserva-se a multidimensionalidade das relações entre os termos; ▪ Todo termo atribuído a um documento tem peso igual. São aquelas que combinam ou coordenam os termos no momento da busca. São utilizadas principalmente em sistemas automatizados, como exemplo posso citar os tesauros. Na indexação pós coordenada a combinação é feita no momento da saída, ou seja, no momento da recuperação da informação. Fazemos a combinação entre termos utilizando operadores booleanos. Operadores booleanos são aqueles de “E” “OU” Preparatório para Concursos em Biblioteconomia Módulo 11 – Aula 1 Prof. Juliete Calazans “NÃO”. Por exemplo: posso usar o termo “álbum” o operador booleano “e” e outro termo “fotografia” para recuperar os itens que quero com esses termos. 6.2 Sistemas pré coordenados São aquelas que combinam ou coordenamos termos no momento da indexação. Fazem parte desse grupo – os cabeçalhos de assunto e as classificações bibliográficas. A combinação é feita na entrada da indexação, aqui os assuntos são tratados e representados em conjunto de termos já combinados, por exemplo: álbum de fotografia. ▪ Índices impressos; ▪ Catálogos em ficha; ▪ É difícil representar a multidimensionalidade das relações entre os termos; ▪ O primeiro termo é mais importante que os outros; ▪ Os termos devem ser listados numa determinada sequência; ▪ Aos índices impressos preside a permutação e não a combinação, já que não é fácil combinar termos no momento em que se faz uma busca. 6.3 Indexação pós-coordenada VERSUS pré-coordenada Pós-coordenadas: São preferidas pelos usuários pois se “apresentam” melhor em buscas por documentos em bases de dados. Pré-coordenadas: Podem apresentar aplicações mais sofisticadas, mas são bastante limitados na recuperação da informação. 7. COERÊNCIA NA INDEXAÇÃO Como já sabemos, o principal objetivo de um serviço de indexação é assegurar a recuperação de qualquer documento ou informação no momento em que o usuário busca um assunto em um sistema de informações. Dito isso, vamos falar dos fatores que influenciam na coerência da indexação. Define-se de um modo muito pragmático a 'boa indexação' como a indexação que Preparatório para Concursos em Biblioteconomia Módulo 11 – Aula 1 Prof. Juliete Calazans permite que se recuperem itens de uma base de dados durante buscas para as quais eles sejam respostas úteis, e que impede que sejam recuperados quando não sejam respostas úteis" a relação entre concordância e qualidade se dá de forma bastante complexa. O que determina a qualidade da indexação é o estabelecimento de descritores que representem devidamente os assuntos dos documentos, permitindo sua eficaz recuperação. O conceito de coerência é um dos quesitos para uma indexação de qualidade, já que todos os documentos que tratam sobre o mesmo assunto devem estar representados da mesma forma, não havendo perda de informações no momento da recuperação. E os fatores que contribuem para uma coerência na indexação são: 1. Quantidade de termos atribuídos; 2. Vocabulário controlado x Indexação com termos livres; 3. Tamanho e especificidade do vocabulário; 4. Características do conteúdo temático; 5. Fatores que dependem do indexador; a) Educação b) Interesses c) Experiência 6. Instrumentos de auxílio; e 7. Extensão do item. 8. QUALIDADE NA INDEXAÇÃO E se temos coerência, temos qualidade na indexação também. É o que abordaremos agora na aula. Preparatório para Concursos em Biblioteconomia Módulo 11 – Aula 1 Prof. Juliete Calazans Esses são os fatores que o Lancaster considera como influenciadores na qualidade do processo de indexação: fatores ligados ao indexador, vocabulário, documento, processo e os fatores ambientais. 8.1 Fatores ligados ao indexador Os fatores ligados ao indexador possuem quatro subcategorias relacionadas ao profissional. 8.2 Fatores ligado ao vocabulário Podemos dizer que contêm cinco subcategorias ligadas ao instrumento e esses fatores possuem elementos da sua formação. Preparatório para Concursos em Biblioteconomia Módulo 11 – Aula 1 Prof. Juliete Calazans A qualidade do vocabulário de entradas é influenciada pela fundamentação teórica do desenvolvimento do instrumento e o entendimento dos especialistas da área do vocabulário auxilia na qualidade dos termos de entrada. A qualidade da estrutura guiará o indexador ao termo mais adequado, assim, é necessário que os termos estejam especificados e tenham uma relação bem estabelecida. A subcategoria disponibilidade de instrumentos auxiliares afins é relativa às ferramentas que o indexador utiliza para auxiliá-lo no entendimento do assunto do documento. Esses instrumentos são, por exemplo, glossários e manuais, entre outros. 8.3Fatores ligados ao documento Nos fatores ligados ao documento temos 5 subcategorias: A subcategoria complexidade é apresentada, mas não é explicada por Lancaster, ficando difícil o entendimento e a descrição desse elemento; pode-se considerar o documento complexo por causa do conteúdo, do formato, da apresentação, da língua, existindo vários fatores que podem trazer complexidade, o que faria que o significado dessa subcategoria se tornasse incerto. A língua e a linguagem é uma subcategoria influenciada por dois fatores: o primeiro é a língua em que o documento se apresenta, podendo facilitar ou dificultar dependendo da fluência que profissional possui, o segundo é a linguagem utilizada pelo autor que influencia no grau de dificuldade de compreensão pelo indexador. Outra subcategoria é a extensão, porém Lancaster (2004) somente a cita ele, não explanando suas ideias. Acredita-se que a mesma está relacionada à espessura ou à Preparatório para Concursos em Biblioteconomia Módulo 11 – Aula 1 Prof. Juliete Calazans quantidade de volumes de uma obra e este seria um fator que poderia tornar a leitura mais cansativa e confusa. A última subcategoria é a apresentação e sumarização, isto é, quanto mais clara for a apresentação – Lancaster (2004) dá o exemplo do título e a síntese representativa ao documento -, mais facilidade o indexador terá em sua análise, uma vez que esses são os pontos indicados na leitura técnica. 8.4 Fatores ligados ao processo No processo, nós vamos nos deparar com 4 subcategorias: Estes fatores estão relacionados as normas da biblioteca, neste caso, tudo que envolver a biblioteca como a política, os manuais e a cultura da biblioteca, irão influenciar nesse processo de indexação. O tipo de indexação possui duas formas: por extração e por atribuição. Inclusive, vimos os conceitos no início da aula. Indexação por extração é aquela que não exige tanto esforço intelectual e experiencia. Já a indexação por atribuição necessita de um maior conhecimento por parte do indexador. As regras e instruções são a cultura da biblioteca, estão balizados pelas normas e políticas da mesma. Outra subcategoria é a produtividade exigida: esse é um fator que pode prejudicar a qualidade da indexação, pois quando é exigido um grande volume de trabalho, o profissional sente-se pressionado e acaba fazendo o serviço sem muita concentração, buscando terminar no menor tempo possível. Cada documento possui um grau de facilidade menor ou maior para cada indexador, por isso, a quantidade produzida irá depender das obras trabalhadas naquele dia, rendendo mais ou menos. A subcategoria exaustividade da indexação também é influenciada pela política da biblioteca, é nesse documento que estará definido a Preparatório para Concursos em Biblioteconomia Módulo 11 – Aula 1 Prof. Juliete Calazans necessidade que a unidade de informação possui por uma indexação exaustiva ou seletiva. Assim, “a exaustividade, é o resultado de uma decisão administrativa, sendo ela a extensão com que analisamos um dado documento.” (FOSKETT, 1973, p.13). Lancaster (2004) assevera que a indexação exaustiva demanda mais tempo para sua realização que a seletiva. O fator exaustividade, ainda, possui relação com a especificidade no processo de recuperação da informação 8.5 Fatores ligados aos fatores ambientais E por fim, os fatores ambientais: Os fatores ambientais possuem três subcategorias: calefação/ refrigeração, iluminação e ruído. Todos esses elementos influenciam na indexação: o ruído, por exemplo, pode atrapalhar a concentração do indexador; a falta de iluminação dificulta a leitura do documento. 8.6 Quadro esquemático da qualidade na indexação Preparatório para Concursos em Biblioteconomia Módulo 11 – Aula 1 Prof. Juliete Calazans 9. FALHAS NA INDEXAÇÃO E, pra fechar essa aula de indexação, temos as possíveis causas de falhas na indexação. E essas falhas podem ocorrer na fase da análise conceitual ou da tradução. 1. Na fase da análise: Quando acontece na análise, podemos nos deparar com duas situações: a primeira, é quando o indexador deixa de reconhecer um tópico que é potencialmente interessante para os usuários. O segundo ponto é quando ele interpreta um item de forma errada, isso vai acarretar a atribuição de um termo errado, certo? 2. Na tradução: Encontramos dois tipos de falhas, a primeira é quando o indexador deixa de usar o termo mais específico para representar um assunto. E o segundo é quando o indexador utiliza um termo inadequado, nesse caso, essa falha acontece porque o indexador possui uma falta de conhecimento especializado ou porque foi desatento. Preparatório para Concursos em Biblioteconomia Módulo 11 – Aula 1 Prof. Juliete Calazans Referências bibliográficas ANDRADE, Maria Eugênia Albino; OLIVEIRA, Marlene de. A Ciência da informação no Brasil. In: CENDÓN, Beatriz Valadares (Org.) Ciência da informação e biblioteconomia: novos conteúdos e espaços de atuação. Belo Horizonte: Ed. UFMG, 2005. p. 45-60. FUJITA, MSL., org., et al. A indexação de livros: a percepção de catalogadores e usuários de bibliotecas universitárias. Um estudo de observação do contexto sociocognitivo com protocolos verbais [online]. São Paulo: Editora UNESP; São Paulo: Cultura Acadêmica, 2009. 149 p. ISBN 978- 85-7983-015-0. Available from SciELO Books <http://books.scielo.org>. LANCASTER, F. W. Indexação e resumos. Brasília: Briquet de Lemos, 1996. ROBREDO, Jaime. Documentação de hoje e de amanhã. 4.ed., ver. e ampl. Brasília: Edição do Autor, 2005 DODEBEI, Vera Lúcia Doyle. Tesauro: linguagem de representação da memória documentária. Niterói: Intertexto: 2002. LANCASTER, F. W. Indexação e resumos: teoria e prática. 2.ed., rev., atual. e ampl. Brasília, DF: Briquet de Lemos Livros, 2004. SILVA, Daniela Lucas da; et al. Ontologias e Unified Modeling Language: uma abordagem para representação de domínios de conhecimento. DataGramaZero, Rio de Janeiro, v. 10, n. 5, out. 2009. Disponível em: <http://www.dgz.org.br/out09/Art_05.htm>. Acesso em 1 ago. 2016.