Acesso à informação no Brasil e ciência de dados

 Buscou-se compreender de que forma a ciência de dados e as tecnologias de mineração e classificação de textos podem contribuir para uma melhor compreensão, agregada, dos pedidos de acesso à informação. A pesquisa utilizou dados dos pedidos de acesso à informação feitos à Prefeitura Municipal de Sã...

Full description

Bibliographic Details
Main Authors: Claudio Henrique Fontenelle Santos, Ana Lúcia Romão
Format: Article
Language:English
Published: Controladoria-Geral da União 2022-12-01
Series:Revista da CGU
Subjects:
Online Access:https://revista.cgu.gov.br/Revista_da_CGU/article/view/544
_version_ 1797777101739261952
author Claudio Henrique Fontenelle Santos
Ana Lúcia Romão
author_facet Claudio Henrique Fontenelle Santos
Ana Lúcia Romão
author_sort Claudio Henrique Fontenelle Santos
collection DOAJ
description  Buscou-se compreender de que forma a ciência de dados e as tecnologias de mineração e classificação de textos podem contribuir para uma melhor compreensão, agregada, dos pedidos de acesso à informação. A pesquisa utilizou dados dos pedidos de acesso à informação feitos à Prefeitura Municipal de São Paulo (PMSP), de 2012 a 2019, disponíveis no Portal de Dados Abertos da municipalidade, propondo a identificação e classificação das principais questões apresentadas. Os 39.369 textos dos pedidos de acesso submetidos à PMSP foram reunidos em um corpus e submetidos a análise por meio de Classificação Hierárquica Descendente (CHD). Nesse mesmo corpus foram inseridas cinco variáveis demográficas para cada pedido, que foram submetidos a uma rotina padrão de pré-processamento de texto, selecionando 31.946 pedidos (81,16%) para análise pela CHD. Ao propor uma classificação de textos como uma metodologia para análise de dados textuais, reforçou-se um paradigma de que dados textuais não pertencem apenas ao campo qualitativo. Além disso, a consideração de apenas nomes, excluídos verbos e advérbios; e os adjetivos mais ocorrentes serem usados como parte de expressões, permitiu uma otimização do contexto dos pedidos, proporcionando classificar os dados textuais de maneira mais objetiva, mitigando o viés dos investigadores. Da análise por meio da Classificação Hierárquica Descendente resultaram sete classes: 1 - Bairros e distritos; 2 - Trâmite e documentos processuais; 3 - Contratações públicas; 4 - Mobilidade urbana; 5 - Família: saúde, educação e assistência social; 6 - Imóveis; e 7 - Concursos e cargos públicos. O artigo apresenta também outros estudos de caso relevantes para a pesquisa, com referências encontradas na análise de pedidos de acesso à informação , contribuindo para a compreensão de pedidos dos cidadãos de modo aglutinado e permitindo aos tomadores de decisões um melhor entendimento das demandas da sociedade, podendo resultar em políticas públicas mais focadas.
first_indexed 2024-03-12T23:00:17Z
format Article
id doaj.art-ee5428b3a6704cd7b1e61ed1f798c36d
institution Directory Open Access Journal
issn 1981-674X
2595-668X
language English
last_indexed 2024-03-12T23:00:17Z
publishDate 2022-12-01
publisher Controladoria-Geral da União
record_format Article
series Revista da CGU
spelling doaj.art-ee5428b3a6704cd7b1e61ed1f798c36d2023-07-19T14:41:26ZengControladoria-Geral da UniãoRevista da CGU1981-674X2595-668X2022-12-01142610.36428/revistadacgu.v14i26.544Acesso à informação no Brasil e ciência de dadosClaudio Henrique Fontenelle Santos0Ana Lúcia Romão1Controladoria-Geral da UniãoInstituto Superior de Ciências Sociais e Políticas - ISCSP ; Universidade de Lisboa - UL  Buscou-se compreender de que forma a ciência de dados e as tecnologias de mineração e classificação de textos podem contribuir para uma melhor compreensão, agregada, dos pedidos de acesso à informação. A pesquisa utilizou dados dos pedidos de acesso à informação feitos à Prefeitura Municipal de São Paulo (PMSP), de 2012 a 2019, disponíveis no Portal de Dados Abertos da municipalidade, propondo a identificação e classificação das principais questões apresentadas. Os 39.369 textos dos pedidos de acesso submetidos à PMSP foram reunidos em um corpus e submetidos a análise por meio de Classificação Hierárquica Descendente (CHD). Nesse mesmo corpus foram inseridas cinco variáveis demográficas para cada pedido, que foram submetidos a uma rotina padrão de pré-processamento de texto, selecionando 31.946 pedidos (81,16%) para análise pela CHD. Ao propor uma classificação de textos como uma metodologia para análise de dados textuais, reforçou-se um paradigma de que dados textuais não pertencem apenas ao campo qualitativo. Além disso, a consideração de apenas nomes, excluídos verbos e advérbios; e os adjetivos mais ocorrentes serem usados como parte de expressões, permitiu uma otimização do contexto dos pedidos, proporcionando classificar os dados textuais de maneira mais objetiva, mitigando o viés dos investigadores. Da análise por meio da Classificação Hierárquica Descendente resultaram sete classes: 1 - Bairros e distritos; 2 - Trâmite e documentos processuais; 3 - Contratações públicas; 4 - Mobilidade urbana; 5 - Família: saúde, educação e assistência social; 6 - Imóveis; e 7 - Concursos e cargos públicos. O artigo apresenta também outros estudos de caso relevantes para a pesquisa, com referências encontradas na análise de pedidos de acesso à informação , contribuindo para a compreensão de pedidos dos cidadãos de modo aglutinado e permitindo aos tomadores de decisões um melhor entendimento das demandas da sociedade, podendo resultar em políticas públicas mais focadas. https://revista.cgu.gov.br/Revista_da_CGU/article/view/544acesso à informaçãoanálise de texto por computadorclassificação hierárquica descendenteclassificação de tópicospedidos de acesso à informação
spellingShingle Claudio Henrique Fontenelle Santos
Ana Lúcia Romão
Acesso à informação no Brasil e ciência de dados
Revista da CGU
acesso à informação
análise de texto por computador
classificação hierárquica descendente
classificação de tópicos
pedidos de acesso à informação
title Acesso à informação no Brasil e ciência de dados
title_full Acesso à informação no Brasil e ciência de dados
title_fullStr Acesso à informação no Brasil e ciência de dados
title_full_unstemmed Acesso à informação no Brasil e ciência de dados
title_short Acesso à informação no Brasil e ciência de dados
title_sort acesso a informacao no brasil e ciencia de dados
topic acesso à informação
análise de texto por computador
classificação hierárquica descendente
classificação de tópicos
pedidos de acesso à informação
url https://revista.cgu.gov.br/Revista_da_CGU/article/view/544
work_keys_str_mv AT claudiohenriquefontenellesantos acessoainformacaonobrasilecienciadedados
AT analuciaromao acessoainformacaonobrasilecienciadedados