Class Zemberek
java.lang.Object
net.zemberek.erisim.Zemberek
EN:This is a facade for accessing the high level functions of the Zemberek library.
This class should be creatd only once per language.
TR:Zemberek projesine ust seviye erisim icin kullanilan sinif.
Ilk olsum sirasinda kokler okuma ve agac olusumu nedeniyle belli bir miktar gecikme
yasanabilir. Bu sinifin her dil icin sadece bir defa olusturulmasi onerilir.
-
Constructor Summary
Constructors -
Method Summary
Modifier and TypeMethodDescriptionKelime[]
asciiCozumle
(String giris) giris kelimesinin ascii karakter toleransli olarak cozumleyip Kelime cinsinden(kok+ekler) cozumlemelerini dondurur.Kelime[]
asciiCozumle
(String giris, CozumlemeSeviyesi seviye) String[]
asciidenTurkceye
(String giris) Brings the most probable tukish equivalents of a string that uses ascii look alikes of those characters.asciiyeDonustur
(String giris) kelime icindeki dile ozel karakterleri ASCII benzer formalarina dondurur.ayarlar()
Zemberek konfigurasyon parametrelerini dondurur.static ZemberekAyarlari
ayarOlustur
(String disKonfigurasyon) Dosya sisteminden zemberek properties dosyasini yukleyip ZemberekAyarlari nesnesine atar.return the word parser.Zemberek olusumu sirasinda kullanilan DilBilgisi nesnesi doner.int
Basit sekilde giris kelime ya da kelime dizisinin Zemberek olusturulrken kullanilan dil ile benzerligi kestirir.String[]
girilen kelimeyi heceler.Accessor for the syllable extractor.kelimeAyristir
(String kelime) Istenilen kelimenin olasi String acilimlarini bulur.Kelime[]
kelimeCozumle
(String giris) performs morphological parsing of the word.Kelime[]
kelimeCozumle
(String giris, CozumlemeSeviyesi strateji) performs morphological parsing of the word.boolean
kelimeDenetle
(String giris) performs spell checkingkelimeUret
(Kok kok, List ekler) Istenilen kok ve ek listesi ile kelime uretir.kok bulucu mekanizmayi dondurur.String[]
giris kelimesine yakin Stringleri dondurur.Accessor for the word suggestion producer.
-
Constructor Details
-
Zemberek
-
-
Method Details
-
ayarOlustur
Dosya sisteminden zemberek properties dosyasini yukleyip ZemberekAyarlari nesnesine atar.- Parameters:
disKonfigurasyon
-- Returns:
- Throws:
IOException
-
cozumleyici
-
kelimeUretici
-
asciiToleransliCozumleyici
-
oneriUretici
Accessor for the word suggestion producer.- Returns:
- oneri uretici.
-
heceleyici
-
kelimeDenetle
performs spell checking girisin imla denetimini yapar. Eger varsa denetleme cebini kullanir.- Parameters:
giris
- giris kelimesi- Returns:
- EN: true:spell checking successfull, false otherwise. TR: true:imla denetimi basarili. false: Denetim basarisiz.
-
kelimeCozumle
performs morphological parsing of the word. Returns the possible solutions as a Kelime array. Kelime object contains the root and a suffix list. kok() method can be used for accessing the root. ekler() can be used for accessing the Ek object List. giris kelimesinin olasi tum (kok+ekler) cozumlemelerini dondurur.- Parameters:
giris
- giris kelimesi- Returns:
- Kelime sinifi cinsinden dizi. Eger dizinin boyu 0 ise kelime cozumlenemedi demektir. Kelime kokune erisim icin kok(), eklere erisim icin Ek cinsinden nesne listesi donduren ekler() metodu kullanilir.
- See Also:
-
kelimeCozumle
performs morphological parsing of the word. Returns the possible solution(s) as a Kelime array. Kelime object contains the root and a suffix list. kok() method can be used for accessing the root. ekler() can be used for accessing the Ek object List. giris kelimesinin olasi tum (kok+ekler) cozumlemelerini dondurur.- Parameters:
giris
- giris kelimesistrateji
- EN:defines the parsing strategy. TR:cozumleme stratejisini belirler.- Returns:
- Kelime sinifi cinsinden dizi. Eger dizinin boyu 0 ise kelime cozumlenemedi demektir. Kelime kokune erisim icin kok(), eklere erisim icin Ek cinsinden nesne listesi donduren ekler() metodu kullanilir.
- See Also:
-
asciiCozumle
giris kelimesinin ascii karakter toleransli olarak cozumleyip Kelime cinsinden(kok+ekler) cozumlemelerini dondurur. Birden cok cozumun oldugu durumda simdilik donen adaylarin hangisinin gercekten yazidaki kelime olup olmadigi belirlenmiyor. ancak donen sonuclar basitce kok kullanim frekansina gore dizilir. Yani ilk kelime buyuk ihtimalle kastedilen kelimedir.- Parameters:
giris
- giris kelimesi- Returns:
- Kelime sinifi cinsinden dizi. Eger dizinin boyu 0 ise kelime cozumlenemedi demektir. Kelime kokune erisim icin kok(), eklere erisim icin Ek cinsinden nesne listesi donduren ekler() metodu kullanilir. Kelimenin String cinsinden ifadesi icin icerik().toString() metodu kullanilabilir.
- See Also:
-
asciiCozumle
-
asciidenTurkceye
Brings the most probable tukish equivalents of a string that uses ascii look alikes of those characters. asciiCozumle ile benzer bir yapidadir. Farki String[] dizisi donmesi ve donus degerlerinin tekil olmasidir, yani ayni kelime tekrari olmaz.- Parameters:
giris
- giris kelimesi- Returns:
- EN:possible turkish equivalents of the ascii turkish string in a String array. TR:yazilan kelimenin olasi turkce karakter iceren halleri. String[] seklinde.
-
asciiyeDonustur
-
hecele
-
oner
giris kelimesine yakin Stringleri dondurur. Yani eger kelime bozuk ise bu kelimeye benzeyen dogru kelime olasiliklarini dondurur. simdilik - 1 harf eksikligi - 1 harf fazlaligi - 1 yanlis harf kullanimi - yanyana yeri yanlis harf kullanimi. hatalarini giderecek sekilde cozumleri donduruyor. Bu metod dogru kelimeler icin de isler, yani giris "kedi" ise donus listesinde kedi ve kedi'ye benzesen kelimeler de doner. Ornegin "kedim", "yedi" .. gibi.- Parameters:
giris
- giris kelimesi- Returns:
- String sinifi cinsinden dizi. Eger dizinin boyu 0 ise kelime cozumlenemedi demektir.
- See Also:
-
dilTesti
Basit sekilde giris kelime ya da kelime dizisinin Zemberek olusturulrken kullanilan dil ile benzerligi kestirir. Girilen kelime sayisinin azligi soznucun basarimini dusurur. donus farkli seviyelerde olabilir.- Parameters:
giris
- giris string- Returns:
- Donus integer 0-4 arasi deger alabilir. nesne olusturulurken kullanilan dil D ise 0 yazinin D dili olmadigi 4 ise kesin D oldugunu belirtir. ara degerler 1- yazi icinde D olabilecek kelimeler var, ama genel D degil. 2- yazi D, cok fazla yabanci ya da bozuk kelime var. 3- yazi D, yabanci ve bozuk kelimeler iceriyor.
-
dilBilgisi
Zemberek olusumu sirasinda kullanilan DilBilgisi nesnesi doner. Bu nesne uzerinden dile ozel cesitli dil bilgisi islemlerine erisilebilir.- Returns:
- bu nesneyi olustururken kullanilan DilBilgisi arayuzune sahip nesne.
-
kelimeUret
-
kelimeAyristir
Istenilen kelimenin olasi String acilimlarini bulur. Ornegin, "alayim" icin "al-a-yim" ve "ala-yim" cozumleri String dizileri seklinde uretilir. sonucta olusan diziler bir Listeye eklenir.- Parameters:
kelime
- giris kelimesi- Returns:
- Kok ve ek olusumlarini ifade eden String dizilerini tasiyan List. Listinvalid input: '<'String[]> Eger kelime ayristirilamiyorsa sifir uzunluklu String dizisi tasiyan tek elemanli liste doner. .
-
ayarlar
Zemberek konfigurasyon parametrelerini dondurur.- Returns:
- ayarlar.
-
kokBulucu
-