天才之上_第145章 草台班子的第一次會議(1)

作者:一桶布丁·2個月前

「大家好,我陳耀宗,目前工作主要是研究機率論。駱教授跟我提了喬源博士的這個想法後,我就開始思考能否將機率圖模型,比如高斯過程應用到這個問題上。

但思考過後從理論上來說,這是個很蠢的辦法。首先我們需要建立一個帶有優質跟劣質標籤的大規模論文資料集,然後將之轉化為監督分類問題。

顯然是建立這麼一個論文資料集就是個極大的工程。而且要辨別論文是優質還是劣質,或者水論文字需要一個標準………」

。…從最佳化的角度看,我們的目標是要為一個高度非凸且可能存在平坦區域的損失曲面,找到一個能通向全域最優的路徑。

在我看來,一篇高質量的論文,其證明路徑在象的邏輯空間中所形的幾何軌跡應該是迂迴的,但最終能收斂……」

「……我認為可以嘗試將一篇論文的論證過程建模為一個離散力系統。其穩定和收斂可以類比為論證的嚴謹和有效………」

。……基於以上論證,所以我的想法是,我們也許可以從更基礎的特徵工程開始做起。

傳統AI做文字分類,特徵無非是詞袋。TF-IDF。主題模型如LDA。我們可以嘗試構建一個多模態模型,同時理文字。公式和圖表……」

PP

TAGEGAShparG

便

IA

IAIA

IA

使

猜你喜歡

同題材或同分類的其他作品,僅供參考。