Prijava
Korisničko ime:

Lozinka:

remember me

Zaboravili lozinku?

Registrirajte se!
Glavni menu
Potraga
Tko je online
6 korisnika je online (2 korisnika cita Novosti)

članovi: 0
Gosti: 6

više...
HULK-Novosti
Chat WIKI Kontakt
Linux u Hrvata : PostgreSQL stemming za hrvatski
Poslao kost on 20.08.2010 9:32:11 (2233 Čitanja)
Linux u Hrvata

Kao što ste već mogli čuti u nultom podcastu, Ivan Voras napravio je PostgreSQL stemming za hrvatski. To je nešto za sve one koji žele koristiti full text search u PostgreSQL-u sa modulom tsearch2 ali su primjetili da to nema puno smisla sa Hrvatskim jezikom bez modula za stemming koji će smanjiti broj varijacija riječi na nešto prihvatljivo. Arhiva sadrži dva dijela - ispell rječnik Denisa Lackovića prilagođen za tsearch2 i popratne SQL skripte te modul dict_regex za tsearch2 koji implementira regex transformacije na riječima, sa skupinom regex pravila za više-manje heuristički stemming jezika. Ovi dijelovi se mogu koristiti zasebno (češće) ili zajedno (uz malo dodatnog rada) a rade sa UTF-8. Modul je raspoloživ sa http://ftp.linux.hr/lokalizacija/postgresql/.

Stranica pripremljena za ispis Pošaljite priču prijatelju
Komentari su osobni stavovi autora. Admini ne odgovaraju za njihov sadržaj.
Copyright © 1995-2009 HULK web team. Sva prava pridržana. RSS. Engine: XOOPS