GYAKRAN ISMTELT KRDSEK S SZTRPTSI SEGDLET 1.2

Hogyan tudok segteni?
======================

- magyar nyelv knyveken, hroldalakon futtatod vgig a Magyar Ispellt, a fel nem ismert szavakat
  kigyjtd. Ha sszegylt pr hinyz sz, elkldd a levelezlistra (magyarispell@yahoogroups.com).

  Magyar nyelv knyvek: http://www.neumann-haz.hu, Digitlis Irodalmi Akadmia,
  J, ha jelzed a listn, hogy melyik knyvnek lltl neki.

- Tpushibkat keresel a ragozsban (hinyz ragozs, magnhangz tvesztsek, stb.),
  ezt jelzed (ez is elg), vagy kijavtod a ragozsi tblzat forrst (aff.*), s 
  a mdostsokat elkldd a levelezlistra.

- Elvllalod egy szakszkincs feldolgozst, vagy gondozst, kezdve azzal, hogy
  szakcikkeken futtatod vgig az ispellt.

- Ellenrzd az alapszkincs llomnyait, a fnevek kztt mellknevekre vadszva, stb.
  mivel ez mg nem igazn trtnt meg, (nagyon felletesen, automatizlva, s kapkodva
  kszlt, br azta helyenknt t lett fslve).

- A helyesrsi sztr alapjn megvizsglod, hogy mely szsszetteleket fogad el hibsan
  a Magyar Ispell, amit klnben kln kellene rni (itt rdemes felosztani a 
  helyesrsi sztrt egyms kzt, pl. kezdbetk alapjn).

- Stb.


Hogyan dolgozhatok fel gyorsan tbb knyvet?
===========================================

sszefzd, szavakra trdeled, rendezed, az ismtlseket kiszrd, 
majd az ispell -l kapcsoljval kigyjtd azokat belle, amelyeket
nem ismer fel az ispell. A Magyar Ispell tartalmaz egy break
nev programot, ami az ismtlsek kiszrsig mindezt megcsinlja.

bin/break book1 book2 book3 book* | ispell -l -d magyar >hiany

Nehz helyesrs-ellenrzt csinlni?
======================================

Nem, de igen nehz befejezni...

A Magyar Ispell egyemberes, egy hnapos projektnek indult 1998-ban.
Hatrozott elny volt, hogy a helyesrs-ellenrz ekkor
mr kszen volt (sokak munkjnak ksznheten, ld. man ispell.)
Az Ispell nem igazn agglutinl nyelvekhez kszlt
ellenrz. Hla Geoff Kuenningnek azonban olyan
teljestmnnyel s kpessggel lett felruhzva, hogy a 
szoksosnl pr nagysgrenddel nagyobb ragozsi tblzatot is
hatkonyan kezel. Az egy hnaphoz mg hozzjtt 1999 nyara,
s a szkincs, valamint a ragozsi szablyok a trgyas igk 
kivtelvel kszen lltak. Kt v kihagys kvetkezett, majd
2001. szeptember krnykn tbben rdekldni kezdtek,
mint pldul Nagy Viktor (ElMe Morfolgiai elemz,
Perl-ben kszlt magyar helyesrs-ellenrz szerzje),
s Sznt Tams (Magyar KDE Projekt). A tesztels fradsgos
munkjt magra vllalta Tams, s ksbb tbben csatlakoztak hozz, 
rm csak a bvts, fejleszts s a hibajavts maradt.
Az eredmny itt van.

Ez az a projekt, amit a Szchenyi-terv tmogat Ispell, Aspell bvts, Kspell, Mspell, s 
otthoni hasznlatra ingyenes linuxos helyesrs-ellenrz, illetve egyb nyelvi
segdprogramok elksztse cmn?
=========================================================================================

Nem.


Mikor lesz ksz a magyar nyelv, magyar helyesrs-ellenrzvel,
elvlasztssal, s szinonimasztrral rendelkez ingyenes
OpenOffice/KOffice/Abiword stb.?
==================================================================

Remljk, minl elbb! 

Magyar OpenOffice.org: http://office.fsf.hu

A Magyar Ispell KWord-ben, AbiWord 0.7.x-ben, s OpenOffice-ban 
tkletesen hasznlhat.

A kivl magyar elvlaszts mr rgta elrhet Linuxon, rszben a
TeX/LaTeX-hez kszlt huhyph.tex (Mikls Dezs s Mayer Gyula),
rszben Verhs Pter Hion programja rvn. 

A szinonimasztrhoz mr elrhetk szanyagok az Interneten, mint pldul
a Magyart Knyvecske.

Pontosan mi is van az OpenOffice-szal?
=======================================

Az OpenOffice helyesrs-ellenrzje a C-s Ispell 
C++-ostsval kapott Myspell, Kevin Hendricks munkja.
Kpessgei csaknem megegyeznek az Ispellel, csak futsidben
lltja el a ragozsi sztrt az alapsztrbl s ragozsi tblzatbl.
Emiatt ms a ragozsi tblzatnak a formtuma.

A Magyar Ispell 0.62-nak mr rsze az i2myspell talakt program,
ami szablyos myspell ragozsi tblzatot llt el Ispell
ragozsi sztrakbl, gy a magyarbl is.

Az OpenOffice 614C mr tartalmazza a magyar kezetes karaktereket kezelni 
kpes myspellt. A myspell tesztprogramja 24 Mb RAM mellett nem, de 32Mb 
mellett villmgyorsan elindult, s jl mkdtt. El kell mondani, hogy lassabbnak tnt,
mint az Ispell, de ezen lnyegesen javtani lehet, ha cskkentjk
a hasonl szavak keressnl a kiprblt fonmk halmazt, amit
egyszeren megtehetnk (lehet, hogy a jelenlegi sebessg is megfelel 
persze a szvegszerkesztn, vagy valamivel gyorsabb gpen bell).

God Ferenc ksztett egy oldalt, ahonnan 
megtallhatak azok a belltsok, amelyek mellett
hasznlhat a Magyar Ispell OpenOffice alatt, ld. http://www.trillian.hu

A Magyar Ispell hibtlan?
=========================

A honlap kpernykpe mutatja, hogy jelenleg nincs hibtlan 
helyesrs-ellenrz (szellenrz) a magyar nyelvhez. A kvetkez elvek
rvnyesltek a Magyar Ispell ksztsnl:

Ne fogadja el a gyakori s slyos helyesrsi hibkat s az eltseket, 
amelyek nem ltez alakokat eredmnyeznek.

Lefedje az tlagos szkincset.

Lehetsg szerint csak a ltez alakokat fogadja el.

A harmadik magban foglalja az els kettt, taln knnyebb lett volna
ezen az ton indulni? Nem. A ragozsi osztlyok (amibe szzasval zsfolhatk 
a szablyok) szma pr tucatra van korltozva, csak most trtek t a Linux 
terjesztsek az alaprtelmezett 52 osztlyos
ragozsi sztrformtumra (elkpzelhet, hogy a szintn friss finn
ragozsi sztrnak ksznhet, melynek hasonl problmkkal kellett
megkzdenie, mint a Magyar Ispellnek.). A Magyar Ispellben mr 
harminc felett van az osztlyok szma, pedig szmos osztlyt mg 
tovbb kell bontani, hogy nyilvnvalan hibs alakokat ne ismerjen
fel helyesnek az Ispell.

Szerencsre ezek az alakok szinte soha nem kerlnek el, mivel legalbb kt
betben eltrnek a ltez alakoktl (nos, van kivtel, de nem knny
megtallni).

A fejleszts vratlan eredmnye volt, hogy a megoldhatatlannak tn
egybers-klnrs problmjra az Ispell rszben megoldst 
biztost! A szavakbl levlogathat azon szavak halmaza 
amelyek szsszettelben szerepelhetnek a halmaz ms tagjaival.
Ez kevsnek tnt eleinte, de kiderlt, hogy a slyos egybersi hibk
jelents rsze kiszrhet mg ezzel az egy halmazzal is.

(Egybknt ahogy mshol olvashat, az egszre rfr a bels ellenrzs,
ugyanis arra mr nem nagyon jutott id. Eddig szinte csak fekete doboz 
mdszert hasznltunk. Nagyon szpen krek mindenkit, hogy gy tlje 
meg, hogy ez az els nyilvnos alfa, bta, ami tetszik!)

Mennyi szt tartalmaz a Magyar Ispell?
======================================

Krlbell 35000 alapszt, ami a ragozsi sztr ellltsa
sorn tbb, mint hromszorosra duzzad, mivel csak ilyen 
hibrid mdszerrel (ragozsi szablyok s legenerlt kpzs alakok
vegyesen) lehetett megvalstani a Magyar Ispellt. 

Egy vletlen mintavtelezs alapjn a Magyar Ispell a Magyar
helyesrs szablyaiban tallhat helyesrsi szkincs 70%-t lefedi.
A hinyz rszt (mintegy 7500 szrl van sz) egy ht alatt 
csapatmunkban ptolni lehetne.

Milyen egyb hasznos kapcsoli vannak az Ispellnek?
==============================================

A sztrptst megknnyti, ha az Ispell a szablyos bemenetet
dolgozza fel, gy szavanknt, vagy akr soronknt adhatjuk meg
az ellenrizend szveget.

ispell -a -m -d magyar
szinonima
*
ftetlen
# ftetlen 0
ltatlan
& ltatlan 1 0: lbatlan
ft
+ FA
fapofa
-

rtelmezse: csillag: ebben az alakban a sztrban, +: ragozottknt
elll, # nincs, mg hasonl sem, & nincs, lsd a hasonlkat,
- sszetett szknt elll


Hogyan kszthetjk el a sajt terminolginkat, hasonlan az informatikaihoz?
============================================================================

A kvetkez lers (el)ijeszt, valjban ennl sokkal egyszerbb a sztrpts.
ltalban egyszer szfaji kategorizls megteszi: fonev, melleknev, ige_alanyi,
ige_targy, melleknev. Ne ijedjnk meg, nzzk meg pl. az _informatika modult!

1. make new
Adjunk meg egy modulnevet, pl. botanika
Enter letse utn elll a ./_botanika knyvtr s a r hivatkoz
./Botanika. A knyvtr az _alap/ alapjn jn ltre, s ua. a nev
llomnyokat tartalmazza, de resen.

2. Lpjnk be a knyvtrba, s kezdjk bvteni!
Bizonytalan helyesrs szavakat ellenrizzk le a helyesrsi sztrban,
(vgs esetben a Google-val).

cd _botanika
echo >>fonev iring
echo >>ige_targy kvadrtoz

(Hasznlhatunk szvegszerkesztt is, de ha felfele nyl, Ctrl-r, 
valamint Alt-backspace billentyparancsokat ismerjk, akkor a parancssor
gyorsabb.)

3. Ha ltezik a Botanika->_botanika szimbolikus kts, akkor 
fordtsnl a _botanika modul tartalma is befordul a sztrba. Ha ezt
nem szeretnnk, akkor trljk a ktst:

rm -f Botanika

Ha mgis meggondoltuk magunkat:

ln -s _botanika Botanika

Hogyan dntjk el, hogy egy sz mely llomnyokba kerljn?
==========================================================

Meg kell tudnunk klnbztetni a kzneveket, tulajdonneveket,
igket s mellkneveket.

Legyen a sz pl. katona:

1. ez fnv, betesszk a fonev llomnyba.
2. magas magnhangzt (i) tartalmaz sztagra vgzd s
    vegyes hangrend (van benne mg aou)
    vagy csak i magnhangz(ka)t tartalmaz? Nem.
3. mssalhangzra vgzdik? Nem. 
Vge.

Legyen a sz pl. csekk:

1. ez fnv, betesszk a fonev llomnyba.
2. magas magnhangzt (i) tartalmaz sztagra vgzd s
    vegyes hangrend (van benne mg aou)
    vagy csak i magnhangz(ka)t tartalmaz? Nem.
3. mssalhangzra vgzdik? Igen.
    a. -jaje s -ae birtokos  szemlyjelet is kap? Nem. 
    b. b, d, f, k, l, n, p, r s t a vge, s mgis 
	-a/-e birtokos szemlyjelet kap? Nem.
Vge.

Legyen a sz pl. menedk:

1. ez fnv, betesszk a fonev llomnyba.
2. magas magnhangzt (i) tartalmaz sztagra vgzd s
    vegyes hangrend (van benne mg aou)
    vagy csak i magnhangz(ka)t tartalmaz? Nem.
3. mssalhangzra vgzdik? Igen.
    a. -jaje s -ae birtokos  szemlyjelet is kap? Nem. 
    b. b, d, f, k, l, n, p, r s t a vge, s mgis 
	-a/-e birtokos szemlyjelet kap? Igen. Betesszk a fonev_ae llomnyba is.
Vge.

Legyen a sz pl. koszadk:

1. ez fnv, betesszk a fonev llomnyba.
2. magas magnhangzt (i) tartalmaz sztagra vgzd s  (igen)
    vegyes hangrend (van benne mg aou),
    VAGY csak i magnhangz(ka)t tartalmaz?  nem, de a vgeredmny igen.
    a. ragozsa ingadoz (magas s mly ragokkal is elfordul)? Nem.
    b. mly hangrend toldalkokat kap? Igen
    
    Betesszk a fonev_mely llomnyba is.
    
3. mssalhangzra vgzdik? Igen.
    a. -jaje s -ae birtokos  szemlyjelet is kap? Nem. 
    b. b, d, f, k, l, n, p, r s t a vge, s mgis 
	-a/-e birtokos szemlyjelet kap? Igen. Betesszk a fonev_ae llomnyba is.
Vge.

Egybknt ha a sz ingadoz ragozs (fotellel, fotellal) bekerl a fonev_ing-be

Ha a -ja/-je -a/-e szemlyjelet is elviseli (pl. monitora, monitorja), akkor
a fonev_jajeae-be is bekerl

Ha c, g, h, j, m, s, x, y, v, vagy z a vge, s mgis csak -ja/-je ragot kap,
bekerl a fonev_jaje-be (pl. lnya)

(A semleges i magnhangzt tartalmaz utols sztag 
szavak gyakran kapnak mly ragokat: nyllal, forinttal, stb.
a magas hangrend, csak e, -t tartalmazak nagyon ritkk, pl.
derkkal)

Igk
----

1. Trgyas ragozs-e az ige? 

pl. titkostja a kutyt: titkost -> ige_targy
de! titkostdja a kutyt mr nem cseng jl: titkostdik -> ige_alanyi

2. A mly hangrendre ugyanaz vonatkozik, mint a fnevekre.

3. -tat/-tet, vagy csak -at/-et mveltet ige kpzket kap?

titkosttat, s nem titkostat.  Nem csinlunk vele semmit.
Ha -at/-et ragos egy ige, pl. ad/adat, akkor mindkt alak szerepel
az ige_targy-ban, s az ige_tat_kiv llomnyban is (az utbbiban
azrt, hogy a program ne lltsa el az adtat s az adattat alakokat.)

Mellknevek
===========
igkhez hasonlak. A fneveknek van mellknvkpzs (-es/-os, -i, -j,-j)
vltozata is, gy ezek, hacsak nem valamilyen szsszettel (pl.
nagyszj), elllnak a fnevekbl is.

Tulajdonnevek
=============

Az llomnyok formtuma elsre kicsit zavar lehet:
ha egy tulajdonnv nem kap toldalkot a magyar nyelvben 
(mozaiksz, vagy a sz vge idegen), akkor egy tabultor utn
(teht a msodik mezbe) rjuk a szavakat.

	Bastille

Ha ragozzuk, akkor rgtn sor elejre

Einstein

Ha a ragozott alakok kztt mellknvkpzs (kisbets) is akad, akkor
az ugyanebbe a sorba, egy tabultorral elvlasztva rjuk:

Einstein	einsteini

Ragozatlan
==========

Ha sehov nem illik a sz, felvehetjk a ragozatlan
alakok kz. Ha azrt valamilyen mrtkben ragozott,
akkor puskzzunk. A legenerlt magyar.dict-et szrjk meg arra vonatkozan,
hogy egy hasonl ragozs, hangrend, stb. sz milyen ragozsi 
csoportjelzkkel  kerlt a sztrba:

grep  ^milyen/ magyar.dict
milyen/B/V/L/R

A szavunkhoz ugyanezt rendelhetjk hozz a ,,ragozatlan'' llomnyban.

ilyen/B/V/L/R

Ha hibkat tallunk, ksztsnk kln hibalistt!


Nmeth Lszl
Szofi Oktatkzpont
