Acesso à informação no Brasil e ciência de dados
Buscou-se compreender de que forma a ciência de dados e as tecnologias de mineração e classificação de textos podem contribuir para uma melhor compreensão, agregada, dos pedidos de acesso à informação. A pesquisa utilizou dados dos pedidos de acesso à informação feitos à Prefeitura Municipal de Sã...
Main Authors: | , |
---|---|
Format: | Article |
Language: | English |
Published: |
Controladoria-Geral da União
2022-12-01
|
Series: | Revista da CGU |
Subjects: | |
Online Access: | https://revista.cgu.gov.br/Revista_da_CGU/article/view/544 |
_version_ | 1797777101739261952 |
---|---|
author | Claudio Henrique Fontenelle Santos Ana Lúcia Romão |
author_facet | Claudio Henrique Fontenelle Santos Ana Lúcia Romão |
author_sort | Claudio Henrique Fontenelle Santos |
collection | DOAJ |
description |
Buscou-se compreender de que forma a ciência de dados e as tecnologias de mineração e classificação de textos podem contribuir para uma melhor compreensão, agregada, dos pedidos de acesso à informação. A pesquisa utilizou dados dos pedidos de acesso à informação feitos à Prefeitura Municipal de São Paulo (PMSP), de 2012 a 2019, disponíveis no Portal de Dados Abertos da municipalidade, propondo a identificação e classificação das principais questões apresentadas. Os 39.369 textos dos pedidos de acesso submetidos à PMSP foram reunidos em um corpus e submetidos a análise por meio de Classificação Hierárquica Descendente (CHD). Nesse mesmo corpus foram inseridas cinco variáveis demográficas para cada pedido, que foram submetidos a uma rotina padrão de pré-processamento de texto, selecionando 31.946 pedidos (81,16%) para análise pela CHD. Ao propor uma classificação de textos como uma metodologia para análise de dados textuais, reforçou-se um paradigma de que dados textuais não pertencem apenas ao campo qualitativo. Além disso, a consideração de apenas nomes, excluídos verbos e advérbios; e os adjetivos mais ocorrentes serem usados como parte de expressões, permitiu uma otimização do contexto dos pedidos, proporcionando classificar os dados textuais de maneira mais objetiva, mitigando o viés dos investigadores. Da análise por meio da Classificação Hierárquica Descendente resultaram sete classes: 1 - Bairros e distritos; 2 - Trâmite e documentos processuais; 3 - Contratações públicas; 4 - Mobilidade urbana; 5 - Família: saúde, educação e assistência social; 6 - Imóveis; e 7 - Concursos e cargos públicos. O artigo apresenta também outros estudos de caso relevantes para a pesquisa, com referências encontradas na análise de pedidos de acesso à informação , contribuindo para a compreensão de pedidos dos cidadãos de modo aglutinado e permitindo aos tomadores de decisões um melhor entendimento das demandas da sociedade, podendo resultar em políticas públicas mais focadas.
|
first_indexed | 2024-03-12T23:00:17Z |
format | Article |
id | doaj.art-ee5428b3a6704cd7b1e61ed1f798c36d |
institution | Directory Open Access Journal |
issn | 1981-674X 2595-668X |
language | English |
last_indexed | 2024-03-12T23:00:17Z |
publishDate | 2022-12-01 |
publisher | Controladoria-Geral da União |
record_format | Article |
series | Revista da CGU |
spelling | doaj.art-ee5428b3a6704cd7b1e61ed1f798c36d2023-07-19T14:41:26ZengControladoria-Geral da UniãoRevista da CGU1981-674X2595-668X2022-12-01142610.36428/revistadacgu.v14i26.544Acesso à informação no Brasil e ciência de dadosClaudio Henrique Fontenelle Santos0Ana Lúcia Romão1Controladoria-Geral da UniãoInstituto Superior de Ciências Sociais e Políticas - ISCSP ; Universidade de Lisboa - UL Buscou-se compreender de que forma a ciência de dados e as tecnologias de mineração e classificação de textos podem contribuir para uma melhor compreensão, agregada, dos pedidos de acesso à informação. A pesquisa utilizou dados dos pedidos de acesso à informação feitos à Prefeitura Municipal de São Paulo (PMSP), de 2012 a 2019, disponíveis no Portal de Dados Abertos da municipalidade, propondo a identificação e classificação das principais questões apresentadas. Os 39.369 textos dos pedidos de acesso submetidos à PMSP foram reunidos em um corpus e submetidos a análise por meio de Classificação Hierárquica Descendente (CHD). Nesse mesmo corpus foram inseridas cinco variáveis demográficas para cada pedido, que foram submetidos a uma rotina padrão de pré-processamento de texto, selecionando 31.946 pedidos (81,16%) para análise pela CHD. Ao propor uma classificação de textos como uma metodologia para análise de dados textuais, reforçou-se um paradigma de que dados textuais não pertencem apenas ao campo qualitativo. Além disso, a consideração de apenas nomes, excluídos verbos e advérbios; e os adjetivos mais ocorrentes serem usados como parte de expressões, permitiu uma otimização do contexto dos pedidos, proporcionando classificar os dados textuais de maneira mais objetiva, mitigando o viés dos investigadores. Da análise por meio da Classificação Hierárquica Descendente resultaram sete classes: 1 - Bairros e distritos; 2 - Trâmite e documentos processuais; 3 - Contratações públicas; 4 - Mobilidade urbana; 5 - Família: saúde, educação e assistência social; 6 - Imóveis; e 7 - Concursos e cargos públicos. O artigo apresenta também outros estudos de caso relevantes para a pesquisa, com referências encontradas na análise de pedidos de acesso à informação , contribuindo para a compreensão de pedidos dos cidadãos de modo aglutinado e permitindo aos tomadores de decisões um melhor entendimento das demandas da sociedade, podendo resultar em políticas públicas mais focadas. https://revista.cgu.gov.br/Revista_da_CGU/article/view/544acesso à informaçãoanálise de texto por computadorclassificação hierárquica descendenteclassificação de tópicospedidos de acesso à informação |
spellingShingle | Claudio Henrique Fontenelle Santos Ana Lúcia Romão Acesso à informação no Brasil e ciência de dados Revista da CGU acesso à informação análise de texto por computador classificação hierárquica descendente classificação de tópicos pedidos de acesso à informação |
title | Acesso à informação no Brasil e ciência de dados |
title_full | Acesso à informação no Brasil e ciência de dados |
title_fullStr | Acesso à informação no Brasil e ciência de dados |
title_full_unstemmed | Acesso à informação no Brasil e ciência de dados |
title_short | Acesso à informação no Brasil e ciência de dados |
title_sort | acesso a informacao no brasil e ciencia de dados |
topic | acesso à informação análise de texto por computador classificação hierárquica descendente classificação de tópicos pedidos de acesso à informação |
url | https://revista.cgu.gov.br/Revista_da_CGU/article/view/544 |
work_keys_str_mv | AT claudiohenriquefontenellesantos acessoainformacaonobrasilecienciadedados AT analuciaromao acessoainformacaonobrasilecienciadedados |