不知不覺距離上一篇文剛好一年了,想想該回顧一下吧。 寒假跟暑假分別去了日本(東京)跟德國(柏林),不過暫且不在本文內容。
修課
2017Spring
這學期修的比較有趣的課應該是:
機率(A+)
SD Lin的機率課!我覺得這堂課最成功的地方是,課本真的滿硬的(Hogg and Tanis, Probability and Statistical Inference),不過上課給的習題編號是前一版的,新版的題號不一樣Orz 某次偶然發現這本書的中文翻譯本叫做高等統計學...
因為上課每次都昏昏欲睡,所以就很認真地讀了課本,這本書的積分寫得很扎實,尤其是有介紹Bayesian Estimation,還有各式各樣統計檢定與定理的證明!所以後來看一些同學在修的統計學,都可以大概知道一些東西是怎麼證的,觀念比較清楚。
考試的話,有一些題目有點像腦筋急轉彎,有些又很簡單積分一下就出來了,所以寫一些習題還是有幫助的,而且會比較熟悉那些定理怎麼操作,基本上教授講到的範圍我都有大概看一下課本,然後寫個個位數題。
期末則是在教一些RL,因為以前讀過所以就沒很認真Orz,Final Project我是做的Dirichlet Process Mixture,拿它來跑一個UCI上面的椎間盤dataset,單純只是因為一直很想知道Probabilistic Programming在幹麻,結果最後好像也只學到皮毛,不過大概知道那是在做什麼。
非常推一篇由USC的Kevin Knight教授寫的教學文,真的hen幽默,符合我當時看這個的心情XDDDD
Kevin Knight, Bayesian Inference with Tears: a tutorial workbook for natural language researchers
或是看這篇,由Michael Jordan大弟子David Blei寫的,他們基本上就是這個領域的大頭:
Samuel J. Gershmana & David M. Blei, A tutorial on Bayesian nonparametric models
David Blei的Lab好像開發了一個很厲害的Lib,不過還沒有認真學下去:
Edward: A library for probabilistic modeling, inference, and criticism.
有機(A+)
有機是一堂很扎實的課,CTC教得很快,可是也必須要很快,雖然最後教TCA各種機制我實在非常問號,說不考機制期末考一堆結果噴了@@
非常推薦看天堂(秘笈)的作者David Klein寫的課本,很多Brown & Poon課本沒寫到的東西(特別是有一些自己可以想到的case結果課本沒寫,跑去翻Klein結果有很明確地寫下來...)。
課本身就是把各種化合物的各種反應講過去,機制畫一畫這樣。基本上是把投影片跟課本都刷過去了,習題也幾乎寫完,花了超多時間,結果還不是全忘@@
後來發現其實只要把Claisen Condensation、Schiff Base理解清楚,糖類那些各種異構學會,就可以學生化了Orz
雖然都忘了還是覺得這是有學到非常多東西的一門課,特別是知道IR、NMR、MS怎麼看XD(被cue上台的答案都是掰的,結果還對,被CTC問要不要考慮化學系...)
2017Fall
這學期大部份的時間花在有點平淡的必修上,只寫兩門特別有感觸的課:
生化
最生活化的生化,最頭痛念到崩潰的課,不過還是很討厭考古,不如考簡單一點,都考大觀念,不要出那種邊邊角角品質很差的選擇題...
另一方面Lehninger真的洗得不錯,但是有部分(特別是能量)貌似Harper比較好懂一點,不過基本上Lehninger能夠cover大部份教授講的東西,也是大部份圖的來源。
雖然說最後一次出題的某老師上課真的很雷,可是把那個範圍的課本看完真的才恍然大悟,之前東看西看的Signalling全貌大概是怎麼樣子。還有更之前Prof. JJ的DNA Repair,一開始看不出個所以然,不過把各種方式搞清楚之後看後面的各式技術就知道在做什麼了(因為homologous recombination到處都是)!
不過比起各種奇奇怪怪的代謝路徑,實驗科技的東西還是唸起來比較愉快,也比較好看paperXD,覺得這一個學期真的學到滿多的,從完全不知paper在講什麼,到現在大概可以猜出個輪廓,把關係圖畫出來,真的滿有成就感!最後因為雜事太多,課本大概只讀了1/3,很多中間Protein/AA/NA/Lipid代謝的東西都沒看課本有點可惜(可能是潛意識很不喜歡代謝XD)。
DSCA 演算法設計方法論
這堂課原本以為很閒,結果沒有,因為要讀一大堆古早又很難的paper,不過認識了Meggido跟Shamos,有興趣的話可以看: 這篇奇作,不過我寫實做也是寫到崩潰XD
O(n)算出最小包含圓的Megiddo:
LINEAR-TIME ALGORITHMS FOR LINEAR PROGRAMMING IN R3 AND RELATED PROBLEMS - NIMROD MEGIDDO
Computational Geometry開山始祖Shamos的自傳:
The Early Years of Computational Geometry-a Personal Memoir - Michael Ian Shamos
最後面提到:
"Like all fishermen, I sigh at the ones that got away. I wish I had been a participant in some results that escaped me completely: Megiddo's linear-time algorithm for linear programming in two and three dimensions, Lee and Preparata's lineartime algorithm for the kernel of a simple polygon, the results of Tarjan, Chazelle et al. on triangulating polygons, and the Lipton-Tarjan algorithm for separating planar graphs. I came so close with Megiddo. He was visiting CMU for a year in the Graduate School of Industrial Administration, where operations research was done. He called me up one day from across campus and asked whether I knew that my O( n log n) algorithm for the smallest circle enclosing n points in the place was not optimal. I had never heard of him and thought the call was a prank! Now there was a missed opportunity!"
大神間的互動真的非常有趣XD,他的生平非常地精彩,有興趣可以看他的個人頁面!
最後期末報告被強大組員carry一波,做的是很有趣的iso-rectangle面積、輪廓問題,附上簡報!
研究
生化PA
主題是胰臟癌,自己是負責Treatment,不過因為毫無生化底子,就亂做一通,後來看Lehninger才發現好多東西都是可以先看課本有背景知識才會寫、講得比較好QQ
過程中查了一堆化療藥、一堆標靶(但是Ras G12D目前好像還是無解狀),用hackmd附上ref,後來被另一組致敬了,覺得很榮幸XD
最後講到了一些Immunotherapy,促成了Osaka的研究方向,又是另一個崩潰的開始XDDDD
實際報告的時候,講話語速是目前上台經驗中最快的一次,快到CLP說要一直這麼快嗎Orz 可是真的Slide太多了
Microsomal Stability QSAR
這是一個神秘的題目,就是要預測Compound在人體Microsome會不會很容易被分解,蒐集資料花了非常多時間(整理chembl弄下來的東西),
意外學到RDKit這個很猛的Lib:
RDKit: Open-Source Cheminformatics Software
還有看到原本在做NLP的MIT強者也跨足了:
他們好像有Online Demo,還沒試過,看起來很潮!
不過目前我是卡關了,實在是...不是很會標準的ML,只懂些理論是不夠的,用不出來還是枉然QQ
Osaka Retreat
這是一個醫學院國際事務處的活動,不過好像辦得不是很順利。基本上就是另個PA不過組員是大阪大學醫學系的學生,幸運的是,我們的partner是學霸。原本我們想介紹single cell RNA-seq的應用,然後縮小到immunotherapy resistance,再變成PD-1 blockade acquired risistance。最後還是被指導老師LCK打槍了,叫我們回去把CNS近半年的paper都掃過去,找出最"exciting"的來做,於是乎,現在題目變成這兩篇一起講:
- CDK4/6 inhibition triggers anti-tumour immunity
- Cyclin D–CDK4 kinase destabilizes PD-L1 via cullin 3–SPOP to control cancer immune surveillance
當初看到這個標題覺得很特別,一個cell cycle,一個immune checkpoint,是怎麼連在一起的,結果還真的做出機制!沒想到就被LCK接受了,真的很神奇Orz
後記
現在愈來愈多研究是ML+Biomed了,像是:
A machine learning approach to integrate big data for precision medicine in acute myeloid leukemia 還有生物界的preprint風氣也起來了,像是這篇就非常有意思:
以後針對single cell的whole genome/transcriptome作representation learning,感覺可以做出很多神奇的東西,來改善現有biomarker的限制,說不定可能明後年就有個lib叫cell2vec了XDDDDD
另外一個想到的就是,cancer treatment可不可以用一個RL agent來執行,治療就跟下棋一樣,對手一個是疾病一個是棋士,不過training會是個問題,要麼做exploration/exploitation呢Orzzz
這兩個想法就先記錄在此,看看有沒有預言成真XD
其他事情
終於把杜鵑花節辦完了,於是決定接下來的活動都擔任冗員Orz
見證了棒球隊拿到台大盃亞軍的熱血!
在醫學營跟宿營持續耍冗(宿營成為房間睡最久的人Orz)!