İnternet Sayfalarındaki Asıl İçeriği Gösterebilen Akıllı Bir Tarayıcı. Yerlikaya, T. & Uzun, E. In Akıllı Sistemlerde Yenilikler ve Uygulamaları Sempozyumu (ASYU-2010), pages 53-57, 2010. Website abstract bibtex 2 downloads Kelimelerin metin içinde bulunma sıklığını kullanarak arama yapan arama motorlarından elde edilen sonuçlar, HTML içindeki gereksiz kelimelerden etkilenmektedir. Bu çalışmada, herhangi bir eğitim verisi kullanmadan metinlerdeki benzerliklerini tespit edip gereksiz metinleri çıkaran bir uygulama ve bu uygulamadan elde edilen sonuçlar anlatılmaktadır. Bu uygulama sayesinde HTML dokümana göre %90,59 oranında gereksiz kelime temizlenmiştir. Ayrıca, HTML etiketleri ayrıştırılıp içindeki kelimelere kök bulma işlemi uygulandığında sadece kelimelerin %20,38 oranında kökü bulunurken benzer metin tespit uygulaması sayesinde elde edilen kelimelerin %69,55 oranında kelime kökü tespit edilebilmiştir.
@inproceedings{
title = {İnternet Sayfalarındaki Asıl İçeriği Gösterebilen Akıllı Bir Tarayıcı},
type = {inproceedings},
year = {2010},
keywords = {DOM,String similarity,Web Cleaning},
pages = {53-57},
websites = {https://erdincuzun.com/wp-content/uploads/download/2010/intelbrow_2_2.pdf},
id = {9837c603-7bfa-3b16-8887-082ad536f2de},
created = {2018-06-05T12:53:51.941Z},
file_attached = {false},
profile_id = {37fa15c3-e5d0-3212-8e18-e4c72814fd47},
last_modified = {2020-01-16T20:29:39.474Z},
read = {false},
starred = {false},
authored = {true},
confirmed = {true},
hidden = {false},
citation_key = {Uzun2010a},
private_publication = {false},
abstract = {Kelimelerin metin içinde bulunma sıklığını kullanarak arama yapan arama motorlarından elde edilen sonuçlar, HTML içindeki gereksiz kelimelerden etkilenmektedir. Bu çalışmada, herhangi bir eğitim verisi kullanmadan metinlerdeki benzerliklerini tespit edip gereksiz metinleri çıkaran bir uygulama ve bu uygulamadan elde edilen sonuçlar anlatılmaktadır. Bu uygulama sayesinde HTML dokümana göre %90,59 oranında gereksiz kelime temizlenmiştir. Ayrıca, HTML etiketleri ayrıştırılıp içindeki kelimelere kök bulma işlemi uygulandığında sadece kelimelerin %20,38 oranında kökü bulunurken benzer metin tespit uygulaması sayesinde elde edilen kelimelerin %69,55 oranında kelime kökü tespit edilebilmiştir.},
bibtype = {inproceedings},
author = {Yerlikaya, Tarık and Uzun, Erdinç},
booktitle = {Akıllı Sistemlerde Yenilikler ve Uygulamaları Sempozyumu (ASYU-2010)}
}
Downloads: 2
{"_id":"GapEADjo3jDdZqjnx","bibbaseid":"yerlikaya-uzun-nternetsayfalarndakiasleriigsterebilenakllbirtarayc-2010","downloads":2,"creationDate":"2018-07-04T13:05:23.706Z","title":"İnternet Sayfalarındaki Asıl İçeriği Gösterebilen Akıllı Bir Tarayıcı","author_short":["Yerlikaya, T.","Uzun, E."],"year":2010,"bibtype":"inproceedings","biburl":"https://bibbase.org/service/mendeley/37fa15c3-e5d0-3212-8e18-e4c72814fd47","bibdata":{"title":"İnternet Sayfalarındaki Asıl İçeriği Gösterebilen Akıllı Bir Tarayıcı","type":"inproceedings","year":"2010","keywords":"DOM,String similarity,Web Cleaning","pages":"53-57","websites":"https://erdincuzun.com/wp-content/uploads/download/2010/intelbrow_2_2.pdf","id":"9837c603-7bfa-3b16-8887-082ad536f2de","created":"2018-06-05T12:53:51.941Z","file_attached":false,"profile_id":"37fa15c3-e5d0-3212-8e18-e4c72814fd47","last_modified":"2020-01-16T20:29:39.474Z","read":false,"starred":false,"authored":"true","confirmed":"true","hidden":false,"citation_key":"Uzun2010a","private_publication":false,"abstract":"Kelimelerin metin içinde bulunma sıklığını kullanarak arama yapan arama motorlarından elde edilen sonuçlar, HTML içindeki gereksiz kelimelerden etkilenmektedir. Bu çalışmada, herhangi bir eğitim verisi kullanmadan metinlerdeki benzerliklerini tespit edip gereksiz metinleri çıkaran bir uygulama ve bu uygulamadan elde edilen sonuçlar anlatılmaktadır. Bu uygulama sayesinde HTML dokümana göre %90,59 oranında gereksiz kelime temizlenmiştir. Ayrıca, HTML etiketleri ayrıştırılıp içindeki kelimelere kök bulma işlemi uygulandığında sadece kelimelerin %20,38 oranında kökü bulunurken benzer metin tespit uygulaması sayesinde elde edilen kelimelerin %69,55 oranında kelime kökü tespit edilebilmiştir.","bibtype":"inproceedings","author":"Yerlikaya, Tarık and Uzun, Erdinç","booktitle":"Akıllı Sistemlerde Yenilikler ve Uygulamaları Sempozyumu (ASYU-2010)","bibtex":"@inproceedings{\n title = {İnternet Sayfalarındaki Asıl İçeriği Gösterebilen Akıllı Bir Tarayıcı},\n type = {inproceedings},\n year = {2010},\n keywords = {DOM,String similarity,Web Cleaning},\n pages = {53-57},\n websites = {https://erdincuzun.com/wp-content/uploads/download/2010/intelbrow_2_2.pdf},\n id = {9837c603-7bfa-3b16-8887-082ad536f2de},\n created = {2018-06-05T12:53:51.941Z},\n file_attached = {false},\n profile_id = {37fa15c3-e5d0-3212-8e18-e4c72814fd47},\n last_modified = {2020-01-16T20:29:39.474Z},\n read = {false},\n starred = {false},\n authored = {true},\n confirmed = {true},\n hidden = {false},\n citation_key = {Uzun2010a},\n private_publication = {false},\n abstract = {Kelimelerin metin içinde bulunma sıklığını kullanarak arama yapan arama motorlarından elde edilen sonuçlar, HTML içindeki gereksiz kelimelerden etkilenmektedir. Bu çalışmada, herhangi bir eğitim verisi kullanmadan metinlerdeki benzerliklerini tespit edip gereksiz metinleri çıkaran bir uygulama ve bu uygulamadan elde edilen sonuçlar anlatılmaktadır. Bu uygulama sayesinde HTML dokümana göre %90,59 oranında gereksiz kelime temizlenmiştir. Ayrıca, HTML etiketleri ayrıştırılıp içindeki kelimelere kök bulma işlemi uygulandığında sadece kelimelerin %20,38 oranında kökü bulunurken benzer metin tespit uygulaması sayesinde elde edilen kelimelerin %69,55 oranında kelime kökü tespit edilebilmiştir.},\n bibtype = {inproceedings},\n author = {Yerlikaya, Tarık and Uzun, Erdinç},\n booktitle = {Akıllı Sistemlerde Yenilikler ve Uygulamaları Sempozyumu (ASYU-2010)}\n}","author_short":["Yerlikaya, T.","Uzun, E."],"urls":{"Website":"https://erdincuzun.com/wp-content/uploads/download/2010/intelbrow_2_2.pdf"},"biburl":"https://bibbase.org/service/mendeley/37fa15c3-e5d0-3212-8e18-e4c72814fd47","bibbaseid":"yerlikaya-uzun-nternetsayfalarndakiasleriigsterebilenakllbirtarayc-2010","role":"author","keyword":["DOM","String similarity","Web Cleaning"],"metadata":{"authorlinks":{"uzun, e":"https://erdincuzun.com/yayinlar/"}},"downloads":2},"search_terms":["nternet","sayfalar","ndaki","eri","sterebilen","bir","taray","yerlikaya","uzun"],"keywords":["dom","string similarity","web cleaning"],"authorIDs":["QrE2Jk7Eehmqc5trT"],"dataSources":["mqdHLrE2gnaRYnL6B","ya2CyA73rpZseyrZ8"]}