Enriquecimento de Dados com Base em Estatísticas de Grafo de Similaridade para Melhorar o Desempenho em Modelos de ML Supervisionados de Classificação. Barchilon, N., Lopes, H., Kalinowski, M., & Perez, J. In Anais do XXXIX Simpósio Brasileiro de Bancos de Dados, pages 220–233, 2024. SBC.
Author version doi abstract bibtex 3 downloads Esta pesquisa propõe um método para o enriquecimento de conjuntos de dados tabulares utilizando estatísticas de grafo, visando melhorar o desempenho de modelos de ML supervisionados de classificação. O método constrói um grafo a partir da similaridade entre as instâncias do conjunto de dados e extrai características do grafo para enriquecer o conjunto de dados original. Avaliado em 10 conjuntos de dados públicos de diferentes áreas do conhecimento, com 7 modelos de aprendizado de máquina, o método proporcionou um aumento médio de 4,9% na acurácia. Os resultados demonstram a efetividade do método como uma alternativa para melhorar o desempenho de modelos em cenários que conjuntos de dados carecem das características necessárias para as abordagens tradicionais de enriquecimento com a utilização de grafo.
@inproceedings{BarchilonLKP24,
author = {Ney Barchilon and Hélio Lopes and Marcos Kalinowski and Jefry Perez},
title = {Enriquecimento de Dados com Base em Estatísticas de Grafo de Similaridade para Melhorar o Desempenho em Modelos de ML Supervisionados de Classificação},
abstract = {Esta pesquisa propõe um método para o enriquecimento de conjuntos de dados tabulares utilizando estatísticas de grafo, visando melhorar o desempenho de modelos de ML supervisionados de classificação. O método constrói um grafo a partir da similaridade entre as instâncias do conjunto de dados e extrai características do grafo para enriquecer o conjunto de dados original. Avaliado em 10 conjuntos de dados públicos de diferentes áreas do conhecimento, com 7 modelos de aprendizado de máquina, o método proporcionou um aumento médio de 4,9% na acurácia. Os resultados demonstram a efetividade do método como uma alternativa para melhorar o desempenho de modelos em cenários que conjuntos de dados carecem das características necessárias para as abordagens tradicionais de enriquecimento com a utilização de grafo.},
booktitle = {Anais do XXXIX Simpósio Brasileiro de Bancos de Dados},
location = {Florianópolis/SC},
year = {2024},
keywords = {Aprendizado de Máquina, Grafo, Similaridade, Grafo por Similaridade, Predição, Enriquecimento de Dados, Características Topológicas Grafo, Redes Complexas},
issn = {2763-8979},
pages = {220--233},
publisher = {SBC},
doi = {10.5753/sbbd.2024.240196},
urlAuthor_version = {http://www.inf.puc-rio.br/~kalinowski/publications/BarchilonLKP24.pdf}
}
Downloads: 3
{"_id":"GG6BxPGDiZf3Xuybm","bibbaseid":"barchilon-lopes-kalinowski-perez-enriquecimentodedadoscombaseemestatsticasdegrafodesimilaridadeparamelhorarodesempenhoemmodelosdemlsupervisionadosdeclassificao-2024","author_short":["Barchilon, N.","Lopes, H.","Kalinowski, M.","Perez, J."],"bibdata":{"bibtype":"inproceedings","type":"inproceedings","author":[{"firstnames":["Ney"],"propositions":[],"lastnames":["Barchilon"],"suffixes":[]},{"firstnames":["Hélio"],"propositions":[],"lastnames":["Lopes"],"suffixes":[]},{"firstnames":["Marcos"],"propositions":[],"lastnames":["Kalinowski"],"suffixes":[]},{"firstnames":["Jefry"],"propositions":[],"lastnames":["Perez"],"suffixes":[]}],"title":"Enriquecimento de Dados com Base em Estatísticas de Grafo de Similaridade para Melhorar o Desempenho em Modelos de ML Supervisionados de Classificação","abstract":"Esta pesquisa propõe um método para o enriquecimento de conjuntos de dados tabulares utilizando estatísticas de grafo, visando melhorar o desempenho de modelos de ML supervisionados de classificação. O método constrói um grafo a partir da similaridade entre as instâncias do conjunto de dados e extrai características do grafo para enriquecer o conjunto de dados original. Avaliado em 10 conjuntos de dados públicos de diferentes áreas do conhecimento, com 7 modelos de aprendizado de máquina, o método proporcionou um aumento médio de 4,9% na acurácia. Os resultados demonstram a efetividade do método como uma alternativa para melhorar o desempenho de modelos em cenários que conjuntos de dados carecem das características necessárias para as abordagens tradicionais de enriquecimento com a utilização de grafo.","booktitle":"Anais do XXXIX Simpósio Brasileiro de Bancos de Dados","location":"Florianópolis/SC","year":"2024","keywords":"Aprendizado de Máquina, Grafo, Similaridade, Grafo por Similaridade, Predição, Enriquecimento de Dados, Características Topológicas Grafo, Redes Complexas","issn":"2763-8979","pages":"220–233","publisher":"SBC","doi":"10.5753/sbbd.2024.240196","urlauthor_version":"http://www.inf.puc-rio.br/~kalinowski/publications/BarchilonLKP24.pdf","bibtex":"@inproceedings{BarchilonLKP24,\r\n author = {Ney Barchilon and Hélio Lopes and Marcos Kalinowski and Jefry Perez},\r\n title = {Enriquecimento de Dados com Base em Estatísticas de Grafo de Similaridade para Melhorar o Desempenho em Modelos de ML Supervisionados de Classificação},\r\n abstract = {Esta pesquisa propõe um método para o enriquecimento de conjuntos de dados tabulares utilizando estatísticas de grafo, visando melhorar o desempenho de modelos de ML supervisionados de classificação. O método constrói um grafo a partir da similaridade entre as instâncias do conjunto de dados e extrai características do grafo para enriquecer o conjunto de dados original. Avaliado em 10 conjuntos de dados públicos de diferentes áreas do conhecimento, com 7 modelos de aprendizado de máquina, o método proporcionou um aumento médio de 4,9% na acurácia. Os resultados demonstram a efetividade do método como uma alternativa para melhorar o desempenho de modelos em cenários que conjuntos de dados carecem das características necessárias para as abordagens tradicionais de enriquecimento com a utilização de grafo.},\r\n booktitle = {Anais do XXXIX Simpósio Brasileiro de Bancos de Dados},\r\n location = {Florianópolis/SC},\r\n year = {2024},\r\n keywords = {Aprendizado de Máquina, Grafo, Similaridade, Grafo por Similaridade, Predição, Enriquecimento de Dados, Características Topológicas Grafo, Redes Complexas},\r\n issn = {2763-8979},\r\n pages = {220--233},\r\n publisher = {SBC},\r\n doi = {10.5753/sbbd.2024.240196},\r\n urlAuthor_version = {http://www.inf.puc-rio.br/~kalinowski/publications/BarchilonLKP24.pdf}\r\n}\r\n\r\n","author_short":["Barchilon, N.","Lopes, H.","Kalinowski, M.","Perez, J."],"key":"BarchilonLKP24","id":"BarchilonLKP24","bibbaseid":"barchilon-lopes-kalinowski-perez-enriquecimentodedadoscombaseemestatsticasdegrafodesimilaridadeparamelhorarodesempenhoemmodelosdemlsupervisionadosdeclassificao-2024","role":"author","urls":{"Author version":"http://www.inf.puc-rio.br/~kalinowski/publications/BarchilonLKP24.pdf"},"keyword":["Aprendizado de Máquina","Grafo","Similaridade","Grafo por Similaridade","Predição","Enriquecimento de Dados","Características Topológicas Grafo","Redes Complexas"],"metadata":{"authorlinks":{}},"downloads":3},"bibtype":"inproceedings","biburl":"https://bibbase.org/network/files/KuRSiZJF8A6EZiujE","dataSources":["q7rgFjFgwoTSGkm3G","iSfhee4nHcHz4F2WQ"],"keywords":["aprendizado de máquina","grafo","similaridade","grafo por similaridade","predição","enriquecimento de dados","características topológicas grafo","redes complexas"],"search_terms":["enriquecimento","dados","com","base","estat","sticas","grafo","similaridade","para","melhorar","desempenho","modelos","supervisionados","classifica","barchilon","lopes","kalinowski","perez"],"title":"Enriquecimento de Dados com Base em Estatísticas de Grafo de Similaridade para Melhorar o Desempenho em Modelos de ML Supervisionados de Classificação","year":2024,"downloads":4}