[Mat07] FW: bioinformatika vizsga
Cseh Ágnes
csagnes at math.bme.hu
2010. Május. 17., H, 10:49:24 CEST
Sziasztok!
Írtam Istvánnak, hogy mi a kettes szint (azt hiszem, elég embert érdekel). Igen részletes válaszát alább olvashatjátok. Megkérdezte, hogy akarunk-e konzultációt, ahol ezeket elmondaná. Mivel a 26-i vizsgán már 12-en vagyunk, előtte összegyűlhet elég érdeklődő. Aki szeretne jönni, az írjon nekem, olyan 5 főtől szólok, hogy legyen konz.
Ági
> Date: Mon, 17 May 2010 10:29:23 +0200
> From: miklosi at renyi.hu
> To: csagnes at math.bme.hu
> Subject: Re: bioinformatika vizsga
>
> Szia Ági!
>
> Azt gondolom, hogy egy matematikus-hallgatónak három dolgot kell tanulnia:
>
> - a precíz, szabatos matematika nyelvet
> - 'trükköket', bizonyítási eljárásokat
> - szemléletet.
>
> A "definíció-tétel-bizonyítás" nyelvet bizonyára mások
> megtaníták/megtanították nektek, a bioinfo kurzus célja részben néhány
> trükk tanulása, és leginkább a szemlélet megtanítása.
>
> Ennek tükrében az elégséges szint eléréséhez szükséges tudásra az
> alábbi sillabuszt állítottam össze a vizsgatételekre lebontva:
>
> 1. Tudni kell a Chomky- hierarchia négy szintjét. Tudni kell, hogy a
> felső két szint a 'reménytelenül nehéz' (eldönthetetlen, ill.
> NP-teljes), az alsó két szintre az érdekes kérdések döntő többsége
> polinom futási időben megoldható. Tudni kell, hogy a regularitás
> egyfajta memóriamentességet, illetve véges memóriát jelent, a
> környezetfüggetlenséggel pedig elérhető a teszőles mélységű beágyazás
> (gondoljatok pl. a zárójeles algebrai kifejezésekre, illetve az
> álcsomómentes másodlagos RNS térszerkezetkre).
>
> 2. Dinamikus programozni tudni kell az elégséges szinthez is, hiszen a
> kurzuson ez volt a legalapvetőbb trükk. Így az elégséges szinthez
> szükséges, hogy a vizsgázó segítséggel le tudja vezetni legalább a
> Viterbi és a Forward algoritmusokat.
>
> 3. Az EM bizonyítása elég nagy kuruzslás, nem sok szemléletet ad.
> Viszont a kettesért is illik tudni a bizonyítás trükkjét, nevezetesen,
> hogy feltételes entrópia soha nem negatív, és akkor és csak akkor
> nulla, ha a két eloszlás megegyezik. Tudni kell, hogy az EM
> gyakorlatban azt jelenti, hogy várható értékeket számolunk, és ezek
> alapján módosítjuk a paramétereket. Ki kell mondani a tételt: az EM
> algoritmusban a likelihood monoton nő (és értelmezni is kell).
>
> 4. Definiálni kell a posterior decodingot: annak a valószínűsége, hogy
> egy adott karaktert egy adott levezetési szabály szerint vezettünk le,
> feltéve, hogy a szekvenciát vezette le a nyelvtan. Tudni kell a
> Baum-Welch trükkjét: definíció szerint a levezetéseken összegezzük egy
> szabály használat számát szorozva a levezetés valószínűségével,
> gyakorlatban a pozíciókon összegezünk, és ez sokkal gyorsabb. (A
> kétféleképpen számoljuk össze ugyanazt az egyik leggyakoribb
> kombinatorikai trükk, gondoljátok végig, hogy a hol Pólya
> enumerációként, hol Burnside-lemmaként emlegetett csoportelméleti
> tétel az orbitok számainak összeszámolására is ugyanilyen trükkön
> alapul...)
>
> 5. Tudni kell a Chomsky Normál Formát, és azt, hogy CNF-ben a
> levezetések uni-bináris faként reprezentálhatóak (parse tree).
> Dinamikus programozni tudni kell, így a vizsgázónak kis segítséggel
> össze kell tudni eszkábálnia a CYK és az Inside algoritmust.
>
> 6. Tudni kell a posterior decodingot és az EM trükköt, ld. 4. tételnél.
>
> 7. Tudni kell, hogy a szubsztitúciókat időfolytonos Markov modellekkel
> modellezzük, és a dinamika felírható autonóm lineáris
> differenciálegyenletekként. A fa likelihoodja az, hogy a gyökérre
> felteszünk egy random szekvenciát, a stacionárius eloszlásból
> kisorsolva, hagyjuk, hogy minden élen függetlenül evolválódjon az
> adott szubsztitúciós modell szerint, mi a valószínűsége, hogy az adott
> szekvenciákat kapjuk a fa levelein. Aki tud dinamikus programozni, az
> kis segítséggel össze tudja lapátolni a Felsenstein algoritmusát.
>
> 8. Tudni kell a GTJ-féle HMM-et (marha nehéz ám, van három állapot, az
> alfa hélix, a béta lemez meg a rendezetlen, és minden össze van kötve
> mindennel, irányítottan, hurkok megengedettek), és azt, hogy a
> Knudsen-Hein nyelvtan álcsomómentes másodlagos térszerkezeteket vezet
> le. Tudni kell, hogy mindkét modell lényege, hogy a szubsztitúciós
> folyamat van összekapcsolva a nyelvtannal, így mindkét modell
> többszörös szekvenciaillesztéseket vezet le egyetlen szekvencia
> helyett. Érteni kell, hogy ez miért jó: a biológia struktúráknak nem
> csak a karakterösszetétele, hanem a karakterek megváltozásának a
> dinamikája is jellegzetes. Valamint feltesszük, hogy struktúra
> konzervatívabb, mint a szekvencia, a szekvencia megváltozhat, anélkül,
> hogy a struktúra megváltozna.
>
> 9. Tudni, kell, hogy az álcsomómentes térszerkezet felbontható
> körökre, és a térszerkezet energiája a körök energiáinak az összege.
> Tudni kell, hogy mi a partíciófüggvény, és hogy a partíciófüggvény
> számolása során olyan dinamikus programozási rekurzió kell, amelyben
> minden térszerkezetet pontosan egyszer veszünk figyelembe. Tudni kell
> olyan, középiskolában tanult algebrai azonosságot, hogy exp(a+b)=
> exp(a)exp(b). Valamint tudni kell dinamikus programozni, ezek alapján
> segítséggel a Zuker-Sankoff és a partíciófüggvény számoló algoritmus
> egyszerűbb részleteit össze kell tudni lapátolni.
>
> 10. Érteni kell, hogy a Markov modellekre hogyan írjuk fel a
> differenciálegyenleteket, ez alapján a diffegyenletrendszer felírása
> nem lehet nehéz. A trükk az, hogy bevezetünk egy generátorváltozót, a
> generátorváltozó megfelelő hatványával szorozzuk meg az egyenleteket
> és ezeket összeadjuk. Az egyenletben szereplő n-eket a
> generátorfüggvény generátorváltozó szerinti parciális deriváltjával
> hozzuk létre, így írjuk át a differenciálegyenletrendszert egy
> parciális differenciálegyenletbe. A kettesért nem kell tudni megoldani
> a parcdiffet, felírni a partikuláris megoldást, és azt Taylor-sorba
> fejtve kiszámolni az eredeti változókra a megoldást, de tudni kell,
> hogy ez a megoldás menete.
>
> 11. Tudni kell, hogy miben különbözik a TKF91 és TKF92 modell. Tudni
> kell, hogy mindkettő ekvivalens egy-egy páros rejtett Markov modellel.
> Tudni kell, hogy mi a páros rejtett Markov modell, és mit jelent az
> ekvivalencia (létezik valószínűségtartó bijekció a
> szekvenciaillesztések és levezetések között).
>
> 12. Tudni kell a Metropolis-Hastings algoritmust.
>
> 13. A SLEM definíciója, Lazy Markov chain. Ki kell tudni mondani a két
> tételt a SLEM-ről és az epszilonos relaxációs időről. Ki kell tudni
> mondani a multicommodity flow-s tételt és a Cheeger
> egyenlőtlenségeket. Ez utóbbit értelmezni is kell: egy Markov lánc
> akkor és csak akkor konvergál gyorsan, ha nincs benne 'üvegnyak'. Az
> üvegnyak lehet topologikus is (kevés él van a két részhalmaz között)
> és lehet valószínűségi is (az élek valószínűségei túl kicsik).
>
> 14. Tudni kell a Cheeger egyenlőtlenséget. A poset linearizációk
> definíciója. A poset politóp definíciója. Érteni kell a bizonyítás
> lényegét: konvex testben nem lehet üvegnyak.
>
> 15. #P, #P-teljes, FPRAS és FPAUS definíciói. 'Integetés' szintjén
> tudni kell az önhasonló leszámolási problémákat, és ki kell tudni
> mondani a tételt az FPRAS és FPAUS között.
>
> Rebesgettetek valamit konzultációról is. Egy konzultáción pl.
> végigmehetünk ezen a sillabuszon mégegyszer.
>
> Üdv,
> István
>
> Quoting Cseh Ágnes <csagnes at math.bme.hu>:
>
> >
> > Kedves István!
> >
> > Néhányak kérésének eleget téve szeretném megkérdezni, hogy van-e a
> > vizsgán kijelölt elégséges szint. Kérlek, ne vedd zokon a
> > kérdésemet, természetesen nem mindenki a kettesre hajt, de van, aki
> > nem lát esélyt többre (többségünk ráadásul most végez), és szeretné
> > tudni, hogy ehhez pontosan milyen felkészültségre van szüksége. Ha
> > megengeded, a válaszodat továbbítom az évfolyamlistára.
> >
> > Köszönettel,
> >
> > Cseh Ági
_________________________________________________________________
Hotmail: Megbízható e-mail szolgáltatás a Microsoft hatékony LEVÉLSZEMÉT elleni védelmének használatával.
https://signup.live.com/signup.aspx?id=60969
--------- következő rész ---------
Egy csatolt HTML állomány át lett konvertálva...
URL: http://lists.math.bme.hu/pipermail/mat07/attachments/20100517/79bd2e2b/attachment.htm
More information about the Mat07
mailing list