<html>
<head>
<style><!--
.hmmessage P
{
margin:0px;
padding:0px
}
body.hmmessage
{
font-size: 10pt;
font-family:Verdana
}
--></style>
</head>
<body class='hmmessage'>
Sziasztok!<br><br>Írtam Istvánnak, hogy mi a kettes szint (azt hiszem, elég embert érdekel). Igen részletes válaszát alább olvashatjátok. Megkérdezte, hogy akarunk-e konzultációt, ahol ezeket elmondaná. Mivel a 26-i vizsgán már 12-en vagyunk, előtte összegyűlhet elég érdeklődő. Aki szeretne jönni, az írjon nekem, olyan 5 főtől szólok, hogy legyen konz.<br><br>Ági<br><br>&gt; Date: Mon, 17 May 2010 10:29:23 +0200<br>&gt; From: miklosi@renyi.hu<br>&gt; To: csagnes@math.bme.hu<br>&gt; Subject: Re: bioinformatika vizsga<br>&gt; <br>&gt; Szia Ági!<br>&gt; <br>&gt; Azt gondolom, hogy egy matematikus-hallgatónak három dolgot kell tanulnia:<br>&gt; <br>&gt; - a precíz, szabatos matematika nyelvet<br>&gt; - 'trükköket', bizonyítási eljárásokat<br>&gt; - szemléletet.<br>&gt; <br>&gt; A "definíció-tétel-bizonyítás" nyelvet bizonyára mások  <br>&gt; megtaníták/megtanították nektek, a bioinfo kurzus célja részben néhány  <br>&gt; trükk tanulása, és leginkább a szemlélet megtanítása.<br>&gt; <br>&gt; Ennek tükrében az elégséges szint eléréséhez szükséges tudásra az  <br>&gt; alábbi sillabuszt állítottam össze a vizsgatételekre lebontva:<br>&gt; <br>&gt; 1. Tudni kell a Chomky- hierarchia négy szintjét. Tudni kell, hogy a  <br>&gt; felső két szint a 'reménytelenül nehéz' (eldönthetetlen, ill.  <br>&gt; NP-teljes), az alsó két szintre az érdekes kérdések döntő többsége  <br>&gt; polinom futási időben megoldható. Tudni kell, hogy a regularitás  <br>&gt; egyfajta memóriamentességet, illetve véges memóriát jelent, a  <br>&gt; környezetfüggetlenséggel pedig elérhető a teszőles mélységű beágyazás  <br>&gt; (gondoljatok pl. a  zárójeles algebrai kifejezésekre, illetve az  <br>&gt; álcsomómentes másodlagos RNS térszerkezetkre).<br>&gt; <br>&gt; 2. Dinamikus programozni tudni kell az elégséges szinthez is, hiszen a  <br>&gt; kurzuson ez volt a legalapvetőbb trükk. Így az elégséges szinthez  <br>&gt; szükséges, hogy a vizsgázó segítséggel le tudja vezetni legalább a  <br>&gt; Viterbi és a Forward algoritmusokat.<br>&gt; <br>&gt; 3. Az EM bizonyítása elég nagy kuruzslás, nem sok szemléletet ad.  <br>&gt; Viszont a kettesért is illik tudni a bizonyítás trükkjét, nevezetesen,  <br>&gt; hogy feltételes entrópia soha nem negatív, és akkor és csak akkor  <br>&gt; nulla, ha a két eloszlás megegyezik. Tudni kell, hogy az EM  <br>&gt; gyakorlatban azt jelenti, hogy várható értékeket számolunk, és ezek  <br>&gt; alapján módosítjuk a paramétereket. Ki kell mondani a tételt: az EM  <br>&gt; algoritmusban a likelihood monoton nő (és értelmezni is kell).<br>&gt; <br>&gt; 4. Definiálni kell a posterior decodingot: annak a valószínűsége, hogy  <br>&gt; egy adott karaktert egy adott levezetési szabály szerint vezettünk le,  <br>&gt; feltéve, hogy a szekvenciát vezette le a nyelvtan. Tudni kell a  <br>&gt; Baum-Welch trükkjét: definíció szerint a levezetéseken összegezzük egy  <br>&gt; szabály használat számát szorozva a levezetés valószínűségével,  <br>&gt; gyakorlatban a pozíciókon összegezünk, és ez sokkal gyorsabb. (A  <br>&gt; kétféleképpen számoljuk össze ugyanazt az egyik leggyakoribb  <br>&gt; kombinatorikai trükk, gondoljátok végig, hogy a hol Pólya  <br>&gt; enumerációként, hol Burnside-lemmaként emlegetett csoportelméleti  <br>&gt; tétel az orbitok számainak összeszámolására is ugyanilyen trükkön  <br>&gt; alapul...)<br>&gt; <br>&gt; 5. Tudni kell a Chomsky Normál Formát, és azt, hogy CNF-ben a  <br>&gt; levezetések uni-bináris faként reprezentálhatóak (parse tree).  <br>&gt; Dinamikus programozni tudni kell, így a vizsgázónak kis segítséggel  <br>&gt; össze kell tudni eszkábálnia a CYK és az Inside algoritmust.<br>&gt; <br>&gt; 6. Tudni kell a posterior decodingot és az EM trükköt, ld. 4. tételnél.<br>&gt; <br>&gt; 7. Tudni kell, hogy a szubsztitúciókat időfolytonos Markov modellekkel  <br>&gt; modellezzük, és a dinamika felírható autonóm lineáris  <br>&gt; differenciálegyenletekként. A fa likelihoodja az, hogy a gyökérre  <br>&gt; felteszünk egy random szekvenciát, a stacionárius eloszlásból  <br>&gt; kisorsolva, hagyjuk, hogy minden élen függetlenül evolválódjon az  <br>&gt; adott szubsztitúciós modell szerint, mi a valószínűsége, hogy az adott  <br>&gt; szekvenciákat kapjuk a fa levelein. Aki tud dinamikus programozni, az  <br>&gt; kis segítséggel össze tudja lapátolni a Felsenstein algoritmusát.<br>&gt; <br>&gt; 8. Tudni kell a GTJ-féle HMM-et (marha nehéz ám, van három állapot, az  <br>&gt; alfa hélix, a béta lemez meg a rendezetlen, és minden össze van kötve  <br>&gt; mindennel, irányítottan, hurkok megengedettek), és azt, hogy a  <br>&gt; Knudsen-Hein nyelvtan álcsomómentes másodlagos térszerkezeteket vezet  <br>&gt; le. Tudni kell, hogy mindkét modell lényege, hogy a szubsztitúciós  <br>&gt; folyamat van összekapcsolva a nyelvtannal, így mindkét modell  <br>&gt; többszörös szekvenciaillesztéseket vezet le egyetlen szekvencia  <br>&gt; helyett. Érteni kell, hogy ez miért jó: a biológia struktúráknak nem  <br>&gt; csak a karakterösszetétele, hanem a karakterek megváltozásának a  <br>&gt; dinamikája is jellegzetes. Valamint feltesszük, hogy struktúra  <br>&gt; konzervatívabb, mint a szekvencia, a szekvencia megváltozhat, anélkül,  <br>&gt; hogy a struktúra megváltozna.<br>&gt; <br>&gt; 9. Tudni, kell, hogy az álcsomómentes térszerkezet felbontható  <br>&gt; körökre, és a térszerkezet energiája a körök energiáinak az összege.  <br>&gt; Tudni kell, hogy mi a partíciófüggvény, és hogy a partíciófüggvény  <br>&gt; számolása során olyan dinamikus programozási rekurzió kell, amelyben  <br>&gt; minden térszerkezetet pontosan egyszer veszünk figyelembe. Tudni kell  <br>&gt; olyan, középiskolában tanult algebrai azonosságot, hogy exp(a+b)=  <br>&gt; exp(a)exp(b). Valamint tudni kell dinamikus programozni, ezek alapján  <br>&gt; segítséggel a Zuker-Sankoff és a partíciófüggvény számoló algoritmus  <br>&gt; egyszerűbb részleteit össze kell tudni lapátolni.<br>&gt; <br>&gt; 10. Érteni kell, hogy a Markov modellekre hogyan írjuk fel a  <br>&gt; differenciálegyenleteket, ez alapján a diffegyenletrendszer felírása  <br>&gt; nem lehet nehéz. A trükk az, hogy bevezetünk egy generátorváltozót, a  <br>&gt; generátorváltozó megfelelő hatványával szorozzuk meg az egyenleteket  <br>&gt; és ezeket összeadjuk. Az egyenletben szereplő n-eket a  <br>&gt; generátorfüggvény generátorváltozó szerinti parciális deriváltjával  <br>&gt; hozzuk létre, így írjuk át a differenciálegyenletrendszert egy  <br>&gt; parciális differenciálegyenletbe. A kettesért nem kell tudni megoldani  <br>&gt; a parcdiffet, felírni a partikuláris megoldást, és azt Taylor-sorba  <br>&gt; fejtve kiszámolni az eredeti változókra a megoldást, de tudni kell,  <br>&gt; hogy ez a megoldás menete.<br>&gt; <br>&gt; 11. Tudni kell, hogy miben különbözik a TKF91 és TKF92 modell. Tudni  <br>&gt; kell, hogy mindkettő ekvivalens egy-egy páros rejtett Markov modellel.  <br>&gt; Tudni kell, hogy mi a páros rejtett Markov modell, és mit jelent az  <br>&gt; ekvivalencia (létezik valószínűségtartó bijekció a  <br>&gt; szekvenciaillesztések és levezetések között).<br>&gt; <br>&gt; 12. Tudni kell a Metropolis-Hastings algoritmust.<br>&gt; <br>&gt; 13. A SLEM definíciója, Lazy Markov chain. Ki kell tudni mondani a két  <br>&gt; tételt a SLEM-ről és az epszilonos relaxációs időről. Ki kell tudni  <br>&gt; mondani a multicommodity flow-s tételt és a Cheeger  <br>&gt; egyenlőtlenségeket. Ez utóbbit értelmezni is kell: egy Markov lánc  <br>&gt; akkor és csak akkor konvergál gyorsan, ha nincs benne 'üvegnyak'. Az  <br>&gt; üvegnyak lehet topologikus is (kevés él van a két részhalmaz között)  <br>&gt; és lehet valószínűségi is (az élek valószínűségei túl kicsik).<br>&gt; <br>&gt; 14. Tudni kell a Cheeger egyenlőtlenséget. A poset linearizációk  <br>&gt; definíciója. A poset politóp definíciója. Érteni kell a bizonyítás  <br>&gt; lényegét: konvex testben nem lehet üvegnyak.<br>&gt; <br>&gt; 15. #P, #P-teljes, FPRAS és FPAUS definíciói. 'Integetés' szintjén  <br>&gt; tudni kell az önhasonló leszámolási problémákat, és ki kell tudni  <br>&gt; mondani a tételt az FPRAS és FPAUS között.<br>&gt; <br>&gt; Rebesgettetek valamit konzultációról is. Egy konzultáción pl.  <br>&gt; végigmehetünk ezen a sillabuszon mégegyszer.<br>&gt; <br>&gt; Üdv,<br>&gt; István<br>&gt; <br>&gt; Quoting Cseh Ágnes &lt;csagnes@math.bme.hu&gt;:<br>&gt; <br>&gt; &gt;<br>&gt; &gt; Kedves István!<br>&gt; &gt;<br>&gt; &gt; Néhányak kérésének eleget téve szeretném megkérdezni, hogy van-e a  <br>&gt; &gt; vizsgán kijelölt elégséges szint. Kérlek, ne vedd zokon a  <br>&gt; &gt; kérdésemet, természetesen nem mindenki a kettesre hajt, de van, aki  <br>&gt; &gt; nem lát esélyt többre (többségünk ráadásul most végez), és szeretné  <br>&gt; &gt; tudni, hogy ehhez pontosan milyen felkészültségre van szüksége. Ha  <br>&gt; &gt; megengeded, a válaszodat továbbítom az évfolyamlistára.<br>&gt; &gt;<br>&gt; &gt; Köszönettel,<br>&gt; &gt;<br>&gt; &gt; Cseh Ági<br><br>                                               <br /><hr />Hotmail: Megbízható e-mail szolgáltatás a Microsoft hatékony LEVÉLSZEMÉT elleni védelmének használatával. <a href='https://signup.live.com/signup.aspx?id=60969' target='_new'>Regisztráljon most!</a></body>
</html>