Repository logo
 
Publication

Ask the Data no Dados.IPB

datacite.subject.fosCiências Sociais::Ciências da Comunicação
datacite.subject.sdg04:Educação de Qualidade
datacite.subject.sdg08:Trabalho Digno e Crescimento Económico
dc.contributor.authorAlves, Adília
dc.contributor.authorPais, Clarisse
dc.date.accessioned2025-12-18T10:12:37Z
dc.date.available2025-12-18T10:12:37Z
dc.date.issued2025
dc.description.abstractO Instituto Politécnico de Bragança (IPB) mantém os seus dados de investigação na plataforma Dados.IPB (https://dados.ipb.pt). Os dados armazenados nesta plataforma abrangem diversas áreas de conhecimento e estão guardados em distintos formatos (ex: .xlsx, .docx, .pdf, .jpg, .tab). O Dataverse possui metadados que classificam os datasets e que permitem a recuperação dos mesmos e respetivos dados após a introdução, pelos utilizadores, de keywords em campos de pesquisa. Os resultados são obtidos com a execução de querys SQL sobre a base de dados Dataverse PostgreSQL. Mais recentemente é possível pesquisar na plataforma Dataverse utilizando, não só os metadados, mas também os próprios dados. A Inteligência Artificial é um componente em crescimento no ecossistema Dataverse, também na funcionalidade de pesquisa de informação nos dados armazenados nos datasets. A extensão Ask the Data (https://github.com/IQSS/askdataverse/tree/main/askthedata) é uma ferramenta externa ao Dataverse que permite fazer perguntas em linguagem natural sobre os dados contidos nas tabelas do Dataverse (dados tabulares, com extensão .tab). Um ficheiro .tab é um ficheiro de texto delimitado por tabulações, ou seja, é um formato de texto simples onde os valores são separados pelo carater de tabulação (\t). Estes ficheiros são frequentemente usados para armazenar e trocar dados estruturados, como folhas de cálculo, tabelas ou bases de dados. Ficheiros .tab são: leves, legíveis por humanos, compatíveis com várias plataformas, menos ambíguos do que .csv porque o texto pode ter vírgulas e não tem o carater '\t'. São, por isso, amplamente utilizados. O IPB instalou a extensão Ask the Data no Dataverse. Este Large Language Model analisa apenas o conteúdo dos dados tabulares e não a descrição do conjunto de dados ou quaisquer metadados. Depois de instalar esta extensão o IPB começou a desenvolver outra ferramenta externa ao Dataverse, Ask the Data2 utiliza o YOLO, que irá detetar objetos previamente definidos em imagens guardadas no Dataverse e responder a perguntas em linguagem natural.por
dc.identifier.citationAlves, Adília; Pais, Clarisse (2025). Ask the Data no Dados.IPB. In 12º Fórum de Gestão de Dados de Investigação. Bragança
dc.identifier.urihttp://hdl.handle.net/10198/35273
dc.language.isopor
dc.peerreviewedyes
dc.publisherFCCN
dc.rights.urihttp://creativecommons.org/licenses/by/4.0/
dc.subjectDataverse
dc.subjectAsk the Data
dc.subjectYOLO
dc.subjectDados.IPB
dc.titleAsk the Data no Dados.IPBpor
dc.typeconference object
dspace.entity.typePublication
oaire.citation.conferenceDate2025
oaire.citation.title12º Fórum de Gestão de Dados de Investigação
oaire.versionhttp://purl.org/coar/version/c_970fb48d4fbd8a85
person.familyNameAlves
person.familyNamePais
person.givenNameAdília
person.givenNameClarisse
person.identifier.ciencia-id0019-58CC-96C9
person.identifier.ciencia-id6710-AB7A-834B
person.identifier.orcid0000-0002-3792-1968
person.identifier.orcid0000-0001-8655-0123
relation.isAuthorOfPublicationf85c13a5-8370-4647-971d-00b44123739c
relation.isAuthorOfPublication70933b18-ab2e-402c-ab1d-bb33b7552f76
relation.isAuthorOfPublication.latestForDiscoveryf85c13a5-8370-4647-971d-00b44123739c

Files

Original bundle
Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
Ask_the_Data_no_DadosIPB.pdf
Size:
232.54 KB
Format:
Adobe Portable Document Format
License bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.75 KB
Format:
Item-specific license agreed upon to submission
Description: