Html İçinde Gereksiz Kelimeleri Çıkaran Benzer Metin Tespit Uygulaması. Uzun, E. In Akıllı Sistemlerde Yenilikler ve Uygulamaları Sempozyumu (ASYU-2010), pages 48-52, 2010. Website abstract bibtex 2 downloads Kelimelerin metin içinde bulunma sıklığını kullanarak arama yapan arama motorlarından elde edilen sonuçlar, HTML içindeki gereksiz kelimelerden etkilenmektedir. Bu çalışmada, herhangi bir eğitim verisi kullanmadan metinlerdeki benzerliklerini tespit edip gereksiz metinleri çıkaran bir uygulama ve bu uygulamadan elde edilen sonuçlar anlatılmaktadır. Bu uygulama sayesinde HTML dokümana göre %90,59 oranında gereksiz kelime temizlenmiştir. Ayrıca, HTML etiketleri ayrıştırılıp içindeki kelimelere kök bulma işlemi uygulandığında sadece kelimelerin %20,38 oranında kökü bulunurken benzer metin tespit uygulaması sayesinde elde edilen kelimelerin %69,55 oranında kelime kökü tespit edilebilmiştir.
@inproceedings{
title = {Html İçinde Gereksiz Kelimeleri Çıkaran Benzer Metin Tespit Uygulaması},
type = {inproceedings},
year = {2010},
keywords = {DOM,Web Cleaning},
pages = {48-52},
websites = {https://erdincuzun.com/wp-content/uploads/download/2010/crawler_ver_3_2.pdf},
id = {a35a8264-d0a2-3cf1-b012-389f69ae4385},
created = {2018-06-05T12:53:51.772Z},
file_attached = {false},
profile_id = {37fa15c3-e5d0-3212-8e18-e4c72814fd47},
last_modified = {2020-01-16T20:29:39.053Z},
read = {false},
starred = {false},
authored = {true},
confirmed = {false},
hidden = {false},
citation_key = {Uzun2010b},
private_publication = {false},
abstract = {Kelimelerin metin içinde bulunma sıklığını kullanarak arama yapan arama motorlarından elde edilen sonuçlar, HTML içindeki gereksiz kelimelerden etkilenmektedir. Bu çalışmada, herhangi bir eğitim verisi kullanmadan metinlerdeki benzerliklerini tespit edip gereksiz metinleri çıkaran bir uygulama ve bu uygulamadan elde edilen sonuçlar anlatılmaktadır. Bu uygulama sayesinde HTML dokümana göre %90,59 oranında gereksiz kelime temizlenmiştir. Ayrıca, HTML etiketleri ayrıştırılıp içindeki kelimelere kök bulma işlemi uygulandığında sadece kelimelerin %20,38 oranında kökü bulunurken benzer metin tespit uygulaması sayesinde elde edilen kelimelerin %69,55 oranında kelime kökü tespit edilebilmiştir.},
bibtype = {inproceedings},
author = {Uzun, Erdinç},
booktitle = {Akıllı Sistemlerde Yenilikler ve Uygulamaları Sempozyumu (ASYU-2010)}
}
Downloads: 2
{"_id":"skMtiHLSNEN2cZZ9j","bibbaseid":"uzun-htmlindegereksizkelimelerikaranbenzermetintespituygulamas-2010","downloads":2,"creationDate":"2018-07-03T12:59:41.822Z","title":"Html İçinde Gereksiz Kelimeleri Çıkaran Benzer Metin Tespit Uygulaması","author_short":["Uzun, E."],"year":2010,"bibtype":"inproceedings","biburl":"https://bibbase.org/service/mendeley/37fa15c3-e5d0-3212-8e18-e4c72814fd47","bibdata":{"title":"Html İçinde Gereksiz Kelimeleri Çıkaran Benzer Metin Tespit Uygulaması","type":"inproceedings","year":"2010","keywords":"DOM,Web Cleaning","pages":"48-52","websites":"https://erdincuzun.com/wp-content/uploads/download/2010/crawler_ver_3_2.pdf","id":"a35a8264-d0a2-3cf1-b012-389f69ae4385","created":"2018-06-05T12:53:51.772Z","file_attached":false,"profile_id":"37fa15c3-e5d0-3212-8e18-e4c72814fd47","last_modified":"2020-01-16T20:29:39.053Z","read":false,"starred":false,"authored":"true","confirmed":false,"hidden":false,"citation_key":"Uzun2010b","private_publication":false,"abstract":"Kelimelerin metin içinde bulunma sıklığını kullanarak arama yapan arama motorlarından elde edilen sonuçlar, HTML içindeki gereksiz kelimelerden etkilenmektedir. Bu çalışmada, herhangi bir eğitim verisi kullanmadan metinlerdeki benzerliklerini tespit edip gereksiz metinleri çıkaran bir uygulama ve bu uygulamadan elde edilen sonuçlar anlatılmaktadır. Bu uygulama sayesinde HTML dokümana göre %90,59 oranında gereksiz kelime temizlenmiştir. Ayrıca, HTML etiketleri ayrıştırılıp içindeki kelimelere kök bulma işlemi uygulandığında sadece kelimelerin %20,38 oranında kökü bulunurken benzer metin tespit uygulaması sayesinde elde edilen kelimelerin %69,55 oranında kelime kökü tespit edilebilmiştir.","bibtype":"inproceedings","author":"Uzun, Erdinç","booktitle":"Akıllı Sistemlerde Yenilikler ve Uygulamaları Sempozyumu (ASYU-2010)","bibtex":"@inproceedings{\n title = {Html İçinde Gereksiz Kelimeleri Çıkaran Benzer Metin Tespit Uygulaması},\n type = {inproceedings},\n year = {2010},\n keywords = {DOM,Web Cleaning},\n pages = {48-52},\n websites = {https://erdincuzun.com/wp-content/uploads/download/2010/crawler_ver_3_2.pdf},\n id = {a35a8264-d0a2-3cf1-b012-389f69ae4385},\n created = {2018-06-05T12:53:51.772Z},\n file_attached = {false},\n profile_id = {37fa15c3-e5d0-3212-8e18-e4c72814fd47},\n last_modified = {2020-01-16T20:29:39.053Z},\n read = {false},\n starred = {false},\n authored = {true},\n confirmed = {false},\n hidden = {false},\n citation_key = {Uzun2010b},\n private_publication = {false},\n abstract = {Kelimelerin metin içinde bulunma sıklığını kullanarak arama yapan arama motorlarından elde edilen sonuçlar, HTML içindeki gereksiz kelimelerden etkilenmektedir. Bu çalışmada, herhangi bir eğitim verisi kullanmadan metinlerdeki benzerliklerini tespit edip gereksiz metinleri çıkaran bir uygulama ve bu uygulamadan elde edilen sonuçlar anlatılmaktadır. Bu uygulama sayesinde HTML dokümana göre %90,59 oranında gereksiz kelime temizlenmiştir. Ayrıca, HTML etiketleri ayrıştırılıp içindeki kelimelere kök bulma işlemi uygulandığında sadece kelimelerin %20,38 oranında kökü bulunurken benzer metin tespit uygulaması sayesinde elde edilen kelimelerin %69,55 oranında kelime kökü tespit edilebilmiştir.},\n bibtype = {inproceedings},\n author = {Uzun, Erdinç},\n booktitle = {Akıllı Sistemlerde Yenilikler ve Uygulamaları Sempozyumu (ASYU-2010)}\n}","author_short":["Uzun, E."],"urls":{"Website":"https://erdincuzun.com/wp-content/uploads/download/2010/crawler_ver_3_2.pdf"},"biburl":"https://bibbase.org/service/mendeley/37fa15c3-e5d0-3212-8e18-e4c72814fd47","bibbaseid":"uzun-htmlindegereksizkelimelerikaranbenzermetintespituygulamas-2010","role":"author","keyword":["DOM","Web Cleaning"],"metadata":{"authorlinks":{"uzun, e":"https://erdincuzun.com/yayinlar/"}},"downloads":2},"search_terms":["html","inde","gereksiz","kelimeleri","karan","benzer","metin","tespit","uygulamas","uzun"],"keywords":["dom","web cleaning"],"authorIDs":["2wDRMTHtFwJ2yuDZe","4HpuNzTDB77RPysgv","5b3b733dee8f8d100000001d","5def39dfe83f7dde01000144","5df088e2e49680f201000182","5df5e294f65dd9de01000092","5df899bb10b1d1de01000065","5e07e59df1089ddf01000068","5e09b776954ff4de0100000e","5e09f9f652efb3de0100005a","5e0bcc1b94c532f301000122","5e0da1f1675bf1de01000090","5e0e0e86e2dbbedf010000b8","5e1481b108c265de01000083","5e19986a204503de01000062","5e20ad2a5c2065de01000011","5e20c57b5c2065de010001b6","5e21918d3ef35cdf0100002e","5e2304977db53bde01000051","5e266a8e581147f201000063","5e37afcde84c4cf2010000b1","5e473c28d8f94bde01000001","5e4afd90332a9bde01000056","5e56894feb2916df010000d3","5e56cbcf96127bde01000165","5e5ba5ba727df9f3010000af","5e653122ee6356df0100010c","5e654df00c7028de01000107","8zoSQXchLttJr6AC6","9964hBDGgNZN9zXyR","BGBeh5qvFPmPWb8Ju","C6ziTe8aozQPiDWrz","E5628mYtwMMRdJ8Nd","Kc3qvWJfa8ZiaHaLP","PSfrdm9aFaHufkcgt","QrE2Jk7Eehmqc5trT","XossDmHTGbfF9szKw","bQz2KvdGSjcF2XmSP","bk2KWwj9vCGBPERe5","c9n3aGJRRXvDRaSwK","goaW2pn4xnDLBEJZS","hGw6unSeNa5C7Rjcy","hvvgcYMQ79bFKzfQP","j5v4EZErzSRAG9BD9","jdFZvd6w2touNnNg9","jhyQmmMwiAwycxTXE","oQn2fTFvxv8J3zyN9","pjp5sbA3RA2TrLhrk","qqsFtnh63wFY9cg68","tLwaqE5BiAEi9Zoe9","ub7PupXJBzYLdxArZ","vmh4XmXHDB9vbGSqW"],"dataSources":["mqdHLrE2gnaRYnL6B","ya2CyA73rpZseyrZ8"]}