Publication
Ask the Data no Dados.IPB
| datacite.subject.fos | Ciências Sociais::Ciências da Comunicação | |
| datacite.subject.sdg | 04:Educação de Qualidade | |
| datacite.subject.sdg | 08:Trabalho Digno e Crescimento Económico | |
| dc.contributor.author | Alves, Adília | |
| dc.contributor.author | Pais, Clarisse | |
| dc.date.accessioned | 2025-12-18T10:12:37Z | |
| dc.date.available | 2025-12-18T10:12:37Z | |
| dc.date.issued | 2025 | |
| dc.description.abstract | O Instituto Politécnico de Bragança (IPB) mantém os seus dados de investigação na plataforma Dados.IPB (https://dados.ipb.pt). Os dados armazenados nesta plataforma abrangem diversas áreas de conhecimento e estão guardados em distintos formatos (ex: .xlsx, .docx, .pdf, .jpg, .tab). O Dataverse possui metadados que classificam os datasets e que permitem a recuperação dos mesmos e respetivos dados após a introdução, pelos utilizadores, de keywords em campos de pesquisa. Os resultados são obtidos com a execução de querys SQL sobre a base de dados Dataverse PostgreSQL. Mais recentemente é possível pesquisar na plataforma Dataverse utilizando, não só os metadados, mas também os próprios dados. A Inteligência Artificial é um componente em crescimento no ecossistema Dataverse, também na funcionalidade de pesquisa de informação nos dados armazenados nos datasets. A extensão Ask the Data (https://github.com/IQSS/askdataverse/tree/main/askthedata) é uma ferramenta externa ao Dataverse que permite fazer perguntas em linguagem natural sobre os dados contidos nas tabelas do Dataverse (dados tabulares, com extensão .tab). Um ficheiro .tab é um ficheiro de texto delimitado por tabulações, ou seja, é um formato de texto simples onde os valores são separados pelo carater de tabulação (\t). Estes ficheiros são frequentemente usados para armazenar e trocar dados estruturados, como folhas de cálculo, tabelas ou bases de dados. Ficheiros .tab são: leves, legíveis por humanos, compatíveis com várias plataformas, menos ambíguos do que .csv porque o texto pode ter vírgulas e não tem o carater '\t'. São, por isso, amplamente utilizados. O IPB instalou a extensão Ask the Data no Dataverse. Este Large Language Model analisa apenas o conteúdo dos dados tabulares e não a descrição do conjunto de dados ou quaisquer metadados. Depois de instalar esta extensão o IPB começou a desenvolver outra ferramenta externa ao Dataverse, Ask the Data2 utiliza o YOLO, que irá detetar objetos previamente definidos em imagens guardadas no Dataverse e responder a perguntas em linguagem natural. | por |
| dc.identifier.citation | Alves, Adília; Pais, Clarisse (2025). Ask the Data no Dados.IPB. In 12º Fórum de Gestão de Dados de Investigação. Bragança | |
| dc.identifier.uri | http://hdl.handle.net/10198/35273 | |
| dc.language.iso | por | |
| dc.peerreviewed | yes | |
| dc.publisher | FCCN | |
| dc.rights.uri | http://creativecommons.org/licenses/by/4.0/ | |
| dc.subject | Dataverse | |
| dc.subject | Ask the Data | |
| dc.subject | YOLO | |
| dc.subject | Dados.IPB | |
| dc.title | Ask the Data no Dados.IPB | por |
| dc.type | conference object | |
| dspace.entity.type | Publication | |
| oaire.citation.conferenceDate | 2025 | |
| oaire.citation.title | 12º Fórum de Gestão de Dados de Investigação | |
| oaire.version | http://purl.org/coar/version/c_970fb48d4fbd8a85 | |
| person.familyName | Alves | |
| person.familyName | Pais | |
| person.givenName | Adília | |
| person.givenName | Clarisse | |
| person.identifier.ciencia-id | 0019-58CC-96C9 | |
| person.identifier.ciencia-id | 6710-AB7A-834B | |
| person.identifier.orcid | 0000-0002-3792-1968 | |
| person.identifier.orcid | 0000-0001-8655-0123 | |
| relation.isAuthorOfPublication | f85c13a5-8370-4647-971d-00b44123739c | |
| relation.isAuthorOfPublication | 70933b18-ab2e-402c-ab1d-bb33b7552f76 | |
| relation.isAuthorOfPublication.latestForDiscovery | f85c13a5-8370-4647-971d-00b44123739c |
