麻豆国内精品欧美在线-麻豆国内精品久久久久久-麻豆国产在线观看一区二区-麻豆国产在线观看免费-麻豆国产原创-麻豆国产一区二区在线观看

寫對聯,做唐詩,上海這個AI公司正在“復活曹雪芹”互聯網+

商業江湖 2019-05-15 17:16
分享到:
導讀

一些文學問題,最終都是數學問題。

一些文學問題,最終都是數學問題。 國足0:3負于伊朗后,如果以「抱憾馮瀟霆」作為上聯,你會對出什么下聯? 「緬懷謝安石」,這是人工智能給出的答案。 一個讓人吃驚的事實是——今天人工智能的中文閱讀能力達到『高中生』水平,寫作達到『小學生』水平。 這意味著:包括『審批、審計、簡報』等和文字閱讀理解相關的工作可以交給AI來完成;而在不久的將來包括『文案、記者、作家』等和書寫相關的職業也將面臨著AI的挑戰。 終于繼在國際象棋、圍棋等智力游戲領域完成對人類的反超之后,AI進入了『創造性』的工作領域——在文學、音樂等工作中替代人們作文和作曲。 一直以來人們都以為那些重復性的工作會被AI取代,而文藝創造領域一直是人類固守的智力高地,但現在看,在人工智能面前人類沒有什么真正的“智力高地”。 依照這樣的學習速度,距離AI寫出《紅樓夢》——復活曹雪芹的日子或許不遠了。 (達觀數據創始人、CEO陳運文) 在上海張江的浦東軟件園內,「商業江湖」見到了達觀數據的創始人兼CEO陳運文,他們研發的人工智能系統已經可以替代人類進行“閱讀理解”工作,開始在企業審計、文本搜集等領域進行應用。 陳運文是復旦大學計算機博士,曾在百度、盛大、騰訊等負責大數據研發、人工智能和自然語言處理系統,是業內頂級的教授AI學習文字的專家。 他的主要工作就是通過自然語言處理技術讓計算機學會閱讀并書寫文字。
抱憾馮瀟霆,緬懷謝安石 「抱憾馮瀟霆,緬懷謝安石」,這是人工智能系統對出的對聯。 「商業江湖」于1月25日采訪了陳運文,當天中國隊在2019亞洲杯1/4淘汰賽中0-3負于伊朗隊抱憾出局。這輸掉的三球全部源自于國足后衛的失誤,其中尤以馮瀟霆第一球失誤為憾。 在驗證AI性能時,『商業江湖』記者將『抱憾馮瀟霆』作為上聯輸入系統,而AI快速對出來八個下聯,第一個是『緬懷謝安石』。 這個下聯不僅工整,而且意味深長。謝安石是東晉政治家,在「淝水之戰」中以八萬兵士大破百萬敵軍,為東晉贏得十余年的和平,是李白的偶像。 字面上以謝安石對應馮瀟霆,而背后的寓意卻是以『淝水之戰』對應『中伊之戰』,并且用『緬懷』對應『抱憾』。 不知道AI系統是否真的理解這個故事,但如此對句,讓這個下聯在詞字對仗的同時甚至有一絲幽默的味道。 (關于抱憾馮瀟霆,AI對出了8個下聯) AI所以能對出如此工整的下聯和數學相關——越是有規則的中文表達方式,越容易被人工智能學會。 『對聯要求字數相同、押韻、平仄等等,這種規則越多,AI運算起來目標就越明確,所以寫出來的對聯也就越工整。』陳運文說。 陳運文和同事們研發的這套系統名為「倉頡」,取「造字」之意,這是一套用來處理「字詞級別」的系統,而另一套用來「批量處理文章」的系統名為「畢昇」。 『就像小學生學習語文那樣,我們要讓AI學會什么是名詞、動詞、形容詞,理解什么是「主謂賓、定狀補」,讓他們經過大量的閱讀訓練來逐步理解文字的意思。』 陳運文說,今天AI系統對于「詞性」和「句式」的分析遠超很多本科生。 『如果將一個句子放到倉頡系統中,他能快速的分辨出句子結構,什么是主語謂語,什么是倒裝從句,這可能超過很多白領的水準,AI對于規律的掌握,對于邏輯的學習遠超人類。』 現在隨便從網絡上復制一篇新聞稿放到「畢昇」系統中,它能瞬間識別出這種文章的『核心信息』——總共有多少個名詞、動詞、形容詞;人名、地名、單位名。 甚至可以建立人物、事件關系圖,例如文中出現馮瀟霆,那么「畢昇」會以他為主要人物構建人物圖,列出馮瀟霆的隊友、教練、競爭對手、相關人物等等。 (分析新聞稿后,AI自動生成的語義圖譜) 『這和人類的閱讀習慣類似,如看到《三國演義》人們就會想到曹操、劉備、諸葛亮,草船借箭、羅貫中等關鍵詞,然后可以理解這個詞背后想要表達的意思,我們希望計算機也具備這種「力透紙背」的能力,能通過綜合的知識去理解當前的文詞。』 達觀曾將5萬余首唐詩輸入AI系統做分析,發現唐詩中出現最多的字是「人」,其次是「山」和「風」字。『所以唐詩有以人為本的說法。』此外,唐詩中出現最多的顏色是「白色」,包含顏色的詩句中有1/5都是指白色。而唐詩中另兩組高頻詞是「悲和思」、「春和秋」,這給人們慣用的「傷春悲秋」找到了理論依據。 互聯網的出現為AI建立起一個龐大的內容網絡,通過這個網絡,AI幾乎可以掌握人類有文明史以來所有的內容。同樣一個人物或事件,人類能關聯的信息如果是10的話,計算機可能是10萬。 『文史資料無論是采集還是存儲的成本都非常廉價,存儲200萬冊紅樓夢這樣的書籍大概需要2-3T的空間,一年的存儲成本大概只要1000-2000元,這就意味著我們一年只需要花2000元就可以把一座大學的圖書館藏書都給存下來。』 陳運文說,海量的素材資料為人工智能提供了足夠的『運算食糧』,通過閱讀這些內容,AI可以快速學習,像人類一樣理解文本語義。 不要小看『讀懂文本』的能力,實際上今天社會上很多工作都和『閱讀理解』相關,今天達觀的AI系統已經可以『自動寫文章摘要』,能夠『像秘書一樣提煉文章的核心觀點,并且可以分析出文章觀點的正向和負向。』
理科生正在改變文科世界 AI的文本閱讀理解能力為達觀數據在商業社會中找到了盈利的方向。 2016年上半年的某天,陳運文同事接到一個陌生電話,對方自稱是國內知名電信企業某技術部門負責人,對達觀的技術很感興趣,希望能面談。 『我同事當時嚇一跳,以為是騙子。』陳運文說。 但隨后的對話讓他打消了這個疑慮,對方稱他們在網上看到達觀發布的一篇技術文章,和他們當前遇到的一些技術困境相關,希望邀請達觀的技術團隊到深圳做當面交流。 當時,該企業希望提高「用戶搜索」的準確性,作為知名的手機品牌,他們希望快速了解用戶的搜索需求,比如用戶在搜索「XX手機好不好?」的時候,他們可以匹配對應內容。 但漢語的表達方式并不唯一,有時候同樣一個意思可能有多個語句表達,例如上述這句話還可以用「XX手機怎么樣?」「XX手機好用不?」等句式替代,類似這樣的語義搜尋問題讓實力雄厚的大企業也感到困惑。 『不同地區、不同文化程度的人,他們搜索的句子很可能完全不同,我們很難窮盡這種表達方式。 所以在文本閱讀處理時,需要讓計算機靈活適配各種不同的表達。』陳運文說他們后來幫助該企業設計了一個『非常精妙的算法』解決了這個問題。 現在這家公司已經成為達觀長期的合作客戶,而他們的合作也不再局限于「搜索分析」,而已經進入到「信息反饋」領域。 消費者每天會在中文網絡上發布超過100萬條關于企業產品的評價信息。如果讓人來閱讀這些信息,十個人的團隊可能需要一天時間來完成,但人工智能只需要幾分鐘。 『AI系統可以為這些信息去歸檔整理,甚至是貼標簽。』 如AI會判斷每一條評論的屬性,是「積極正向的還是消極負面的」,并為之貼上標簽,同時會抓去關鍵詞來告訴管理者,消費者的評價主要集中在哪些方面。這就方便了品牌方了解用戶需求,了解輿情環境,并做出應對。 『此前這些工作都需要專門的人工處理,而現在計算機都可以完成。』陳運文說。 人工智能的這種『閱讀理解』能力正在逐步改變那些文字工作者的職業環境,很多此前需要人工閱讀審核的工作,今天都交由人工智能來完成,金融機構就是其中之一。 『我們幫助某金融機構設計的系統可以自動識別招股書里面的數據和含義,他們給我們列出來大約3000個審核點,我們讓系統學會識別和判斷,提高人工審核的效率。』 陳運文解釋說,普通企業送審的招股說明書厚達500頁,『常人看一遍就需要一個月』而現在他們用計算機來做初審,可以快速的發現說明書中的『數字錯誤或者重大風險』。 『公司上市往往需要一年得時間過會,其中很重要的原因就是閱讀時間漫長,就算人工分頭來閱讀招股書也需要花費很長時間。』 某全球著名的會計師事務所也是達觀數據的客戶,他們正試圖用AI替代人來來做審計。審計工作中大量的時間都花在「閱讀」上,一旦審計一個公司,這些審計師需要閱讀大量的公司合同進而將數據摘錄到審計底稿中。 現在AI可以幫助他們完成這些工作,AI系統可以將企業合同中的「關鍵要素」抽取出來,然后導入審計師設計好的基礎格式中,用以生成基礎版的審計報告。 『當然,今天的AI還不能取代審計師來做審計報告,但它們可以輔助審計師快速的抽取數據。』 陳運文解釋說,審計師此前需要一個月做的「基礎審計報告」,今天AI「兩分鐘」就可以完成,單從速度方面比較AI比人類有著絕對的優勢。 『人類一秒鐘大概閱讀24-30個字,也就是一條微信的長度,而AI一秒鐘可以閱讀1萬個字,這將極大的縮短人們的工作時間。』 憑借AI『閱讀理解』的能力,現在達觀數據的客戶包括中國光大銀行、中信建投證券、海爾、長虹、平安等機構。 比較而言,今天人工智能在閱讀方面的應用還更多的體現在理解「數字」上,和文字相比,數字顯然更方便人工智能理解閱讀。 『人腦不擅長記憶數字。』這甚至可以從人類文明點起源中找到依據。在公元前2500年,活動在西亞地區的蘇美爾人創立了「楔形文字」,而今天能夠找到的最古老的楔形文字是一塊被稱為『庫辛石板』的泥板。 考古學家破譯了這塊泥板后發現這是一條「財務」信息——『在37個月間,總共收到29086單位的大麥,由庫辛簽核。』 人類第一條文字用來記賬,這說明正是因為人腦不擅長記錄數據,所以才將數字以圖形的方式記錄。現在這種差異以另一種方式延續——人們將不擅長記憶的數據交給電腦來記載。 但隨著人工智能的發展,這些電腦不再局限于記憶數字,而開始通過數字為媒介,逐步進入記憶理解文字的范疇。 現在達觀的文字系統已經從造字閱讀的「倉頡」「畢昇」上升到書寫詩歌「蘇軾」,可以想象隨著AI對于文字掌握能力的提高,「雪芹」的出現或許并不遙遠。 『一些文學問題,最終都是數學問題。』陳運文感慨道。 --END--
版權所有:商業江湖    轉載聯系微信號:living_lu   郵箱:luhl2017@126.com 盧或者,一個有著2年海上經歷的遠洋船員;4年市場經驗的石油銷售,8年媒體經驗的商業記者自媒體人。 同步更新,搜狐號、今日頭條、UC、百家、企鵝號、大風號、網易號等。
AI 閱讀 系統 人工智能 人類
分享到:

1.TMT觀察網遵循行業規范,任何轉載的稿件都會明確標注作者和來源;
2.TMT觀察網的原創文章,請轉載時務必注明文章作者和"來源:TMT觀察網",不尊重原創的行為TMT觀察網或將追究責任;
3.作者投稿可能會經TMT觀察網編輯修改或補充。


主站蜘蛛池模板: 日韩不卡一区二区 | 精品国产91久久久久 | 国自产在线精品免费 | 久久不射电影网 | 教师波多野结衣在线播放 | 女医学护士一级毛片 | 成年人免费在线看的惊悚动作片 | 国内精品国语自产拍在线观看55 | 亚洲精品一区二区观看 | 韩国三级年轻小的胰子完整 | 国产在线欧美精品 | 俄罗斯大逼 | 欧美视频一区二区专区 | 91精品国产人成网站 | 荡女人人爱全文免费阅读 | 亚洲精品97福利在线 | 亚洲成年 | 三上悠亚精品专区久久 | 久久无码AV亚洲精品色午夜麻豆 | 久久AV国产麻豆HD真实乱 | 99视频精品全部免费观看 | 韩国情事伦理片观看地址 | sihu国产午夜精品一区二区三区 | 免费看又黄又爽又猛的视频软件- | 国内外精品免费视频 | wwwav视频| 亚洲精品第二页 | 精灵之森高清在线 | 国产综合图区 | 狠狠综合网 | 久久偷拍国2017的 | 五月色综合婷婷综合俺来也 | 精品乱lun小说 | 99视频在线观看免费视频 | 成年人视频在线免费观看 | 成人啪啪漫画羞羞漫画www网站 | 国产99精品成人免费视频 | 国产九九在线观看播放 | 亚洲一区二区三区不卡在线播放 | 国产在线视频一区二区三区 | 紧身短裙女教师波多野 |