責任編輯:左彬彬 來源:35斗 日期:2024-01-15
“培育出高產、優質、抗性強的作物品種,這是所有育種家的夢想,如果你手里有300份材料,該怎么通過數字化手段去實現它?”
首屆數字種業論壇上,天豐智慧技術總監邢鴻雁博士的這一提問,引發了在場聽眾的深思……
就傳統育種而言,選育動植物新品種過程十分漫長。一個植物新品種一般需要8-10年,畜禽新品種甚至要花費數十年乃至上百年。部分育種家努力鉆研半生,最終也沒有出來一個大品種。又或者,新品種選育出來便已被瞬息萬變的市場淘汰,傾注其中的心血不免令人惋惜。
眾所周知,種質資源是育種的基礎,育種家第一步要做的便是“淘金”。截至2022年底,我國長期保存的農作物種質資源數量已達53.9萬份。保存數量雖位居世界第二,但作物種質資源利用率僅為3.0%~5.0%,有效利用率僅為2.5%~3.0%。
種質資源的收集、保存、鑒定,所耗人力、時間和財力成本巨大,育種家要深入田間地頭做種植材料的鑒定十分困難,盡管他們樂此不疲。
有人將傳統育種比喻為“選美”,育種的最終結果全靠育種家的眼睛,即便是在大數據、人工智能火爆的當下,育種家的經驗仍舊不可取代。
可是,面對一座如此龐大、尚待開發的種質資源大山,單靠育種家的一步一履,或難登頂。
近年來,“BT+DT”成為了全球育種行業最熱門的詞匯。目前,國外種業已進入“常規育種+生物技術+信息化”的育種“4.0時代”,而我國仍處在以雜交選育、分子育種為主的“2.0-3.0時代”。
以拜耳、科迪華為代表的國際種業巨頭,利用人工智能、機器學習等技術,結合海量基因組、表型和環境數據的分析,進行種子的選擇、優化,已紛紛構建起成熟的數字化育種體系。
2020年,拜耳在美國亞利桑那州的馬拉納開設自動化溫室,作為其新的全球玉米產品設計中心,可整合端到端的數字化育種過程,加速其玉米新品種迭代進程。
在種業企業全面擁抱數字技術的同時,國際互聯網巨頭也在積極布局育種賽道。
去年,谷歌的母公司Alphabet公開推出“Mineral”,該項目籌劃已久,自2014年來平均每天可以采集到190000個農田數據點。利用這些數據,Mineral 開發了80個高性能機器學習模型,幫助企業、農民、研究人員和育種家預測作物產量、增加產量、防治害蟲和雜草。
Google Ventures合伙人Andy Wheeler曾表示,“數據將是推動下一波農業生產率提高的工具。”
再看國內,數字技術在交通、消費、物聯網等領域已發展得十分成熟。近些年,阿里、騰訊、京東等互聯網巨頭在農業賽道頻頻落子。可以說,國內要發展數字育種,既是大勢所趨,也是恰逢其時。
回到開篇的提問,數字化育種究竟該如何從展望走向落地,從經驗復制走向自主研發,乃至成熟的產業化應用呢?最近,35斗參加了首屆數字種業論壇,從數十位專家學者的報告和訪談中,我們總結出了一些可行的方向和答案:
追趕:把握數字化機遇,為育種插上隱形翅膀
跨界:多元人才涌入,跑好數字革命的接力棒
降維:減少算法和模型內卷,卷應用贏面更大
聯合:細致分工與一體化鏈接,重塑行業生態
標準:直面育種數據爆炸,回歸育種本質邏輯
追趕:把握數字化機遇,為育種插上隱形翅膀
發展數字育種契合當前我國農業政策和發展戰略,這是一個非常好的機會。
擁有40余年育種經驗的前亞太種子協會(APSA)主席、前先正達中國政府事務總監張孟玉表示,我國的數字技術在農業以外的其他行業發展迅速并逐步成熟,如無人機、無人交通、物聯網、區塊鏈應用、供應鏈管理等。但在數字農業和數字種業方面,剛剛起步,十分滯后。
在有限的應用中,設施農業又占據了大頭。水肥一體化、溫度光源控制、云平臺管理等領域常常可見數字化身影。目前,信息技術在以跨國企業為代表的種業企業逐步得到使用,于中國種業而言,抓住數字化機遇,任重而只爭朝夕。
對此,中國農業大學郭偉龍副教授也提出了一個很有趣的思考:我們常說基因組學已經有很多數據,為什么還要數字化?數字化究竟是什么含義?
哪怕是數據庫也會有好幾個層次,數據化和數字化有著迥異的差距。
通過測序技術采集并獲取大量基因組信息,這個只是數據化的過程。我們真正要做的是數字化,基于海量基因型、表型和環境組學數據,利用算法、模型形成的育種知識庫,對于指導實踐可能更有價值、效率。
種業4.0是一個以數字化為基礎的創新時代。
華大制造李勇副研究員認為,西方國家之所以發展起成熟的育種體系,恰恰是其數字積累起來的領先優勢。如果傳統的種業無法和西方競爭,那么分子育種和數字育種將是趕超的絕佳機會。我國種質資源豐富,在研發力量上也逐漸出現了從政府、科研機構到企業的轉變,這是一個良好的信號。
也許,大數據早已在數字經濟的舞臺上大展拳腳、屢創佳績。如今涉足育種領域,它的神秘面紗正在一點一點揭開,蓄勢待發。
跨界:多元人才涌入,跑好數字革命的接力棒
育種家的戰場,不止于實驗室,也在田野,更在云端。
數字化育種時代,不僅需要遺傳學、分子生物學、生物信息學等領域的“BT”人才,還迫切需要數據科學、人工智能、物聯網、自動化控制、統計學等相關背景的“DT”人才共同參與。
拜耳作物科學的王林博士提到,種子的產出潛力很關鍵,要能適應不同農民、農場的種植環境。育種不僅僅局限于基因組方面的研發,也需要涉及種子“周邊”,如殺蟲、除草、種子管理等。因此,拜耳的育種研發始終是圍繞著客戶最終的需求來規劃。
西南民族大學青藏高原研究院的王嘉博副研究員,其博士研究背景是軟件開發和算法,如今卻在藏區的牦牛基因組選育工作上干勁十足。
在被問到如何與老一輩育種家合作,推動種業數字化轉型時,他提到:我父親從事大豆的傳統育種已有30年,也持續做出了自己的成果。當我和他討論現代的分子技術、數字技術時,父親表示“實踐是最好的答案”。
新技術的出現肯定會帶來革命。一代人比一代人要強,技術發展也會一代比一代更先進。只有深入田間地頭,用數字技術真正地推動種業進步,才能讓老一輩的人相信:這桿槍交給我們可以放心。
中國農科院作物所的張學勇研究員也在接受訪談時表示:這次參會最強烈的感受,就是希望在青年身上。對我們這一輩的育種家來說,田間的數據、實驗室的數據有很多,但是缺乏海量數據的有機整合。而國際上的種業競爭,其實就是國家種質資源的智能化競爭。
或許,當新一代育種家接過這份沉重的“接力棒”時,“彎道超車”或能更快實現。
降維:減少算法和模型內卷,卷應用贏面更大
在過去的一年里,以Chat GPT的火爆為標志,諸如通義千問、文心一言、PaLM 2等生成式人工智能領域的大語言模型紛紛涌現。百度創始人李彥宏曾公開表示:模型本身并不直接產生價值,基于基礎大模型開發出來的應用才是模型存在的意義。
郭偉龍副教授認為,人工智能技術從計算機領域來講已經很成熟,方法已經卷到了一定程度,現在不再卷模型,而是卷應用。邢鴻雁博士也提到,對于數字育種來說,不用去卷算法,哪個好用就用哪個。
天豐智慧CEO張洪也強調,種業科技方面我國的發期刊數量處于絕對領先優勢,但從科學到技術已經出現斷層,從技術到工程化實現還有很長的路要走。
構建育種大模型可以幫助預測和找到優勢的基因,大幅提升育種效率。但是,“有用”一定是決定算法、模型選擇的關鍵因素。
以大豆為例,“中央一號文件”連續4年聚焦大豆擴種。中國農科院作物所的李英慧研究員表示,利用基因組、轉錄組、常規表型等多組學技術的聯合分析,團隊成功發掘了300多個與產量、抗病蟲等相關的基因。
然而,解鎖大豆耐密植基因只是第一步,團隊更希望的是,讓這些基因能夠被育種家切實利用,回應大豆高度依賴進口的國情。
正如慧諾瑞德創始人韓志國所言,表型技術可以實現高通量、自動化獲取和產量、品質、抗性相關的信息數據,看上去非常高大上,脫去華麗的外衣就是光譜檢測技術。我們思考的是:能否為產業做一點事?
從這個角度來看,無論是極智生物的高通量基因測序平臺,還是天豐智慧的GS預測育種,抑或是慧諾瑞德的高通量表型鑒定,讓技術更加落地、平臺更加實用,或許才是千千萬萬個數字化育種人員的終極夢想。
聯合:專業分工與一體化鏈接,重塑行業生態
在這場數字化革命中,傳統種企或許才是感觸最深的。
去年,來自紅船啟航地的浙江大禾種業董事長朱娟,毅然決然地加入了數字種業聯盟,擁抱數字化育種,尋求企業轉型。
朱娟認為,在數字化育種中,傳統種企更多關注“效率”,如何精準地能夠為種業企業和農民的增收增效服務,這是企業最關注的點。數字種業聯盟的成立,有望實現種業企業、科研單位從點到線的有機鏈接,對于加速傳統種企業加速品種迭代會起到至關重要的推動作用。
中國農科院作科所/國家南繁研究院張學才研究員對此的思考是:提高育種過程的效率,而不僅僅是單一技術的效率。要解決好種質、算法和育種實踐的結合問題,從種到收、從選品種到測序,每個過程、環節都需要數字化賦能。
李勇研究員也表示,數字育種的價值鏈很長,而行業的專業化服務遠遠不夠,這也是我們強調的數字化聯盟的重要性所在。
合肥智能育種加速器大科學裝置(海霸設施)首席科學家吳麗芳強調,通過平臺將各環節的數據、技術和設備進行整合,為育種家提供便利是大科學裝置的創立初衷。
我們不需要做重復的工作,要充分利用各方資源,合作共贏。未來,在種質創新、新基因快速挖掘、知識產權保護、核心種質資源數據共享等方面,大家有很多合作空間。
在國家種業振興大背景下,如何將行業內好的育種技術真正落地,做到產業化應用非常關鍵。
極智基因創始人焦成智表示,單打獨斗非常難,通過組建聯盟,把各方先進的育種技術進行整合,真正賦能下游的新品種培育、種質的創新,甚至未來農業食品加工等一系列的產業應用。
標準:直面育種數據爆炸,回歸育種本質邏輯
當前,全球正處于“數據爆炸”時代。
2022年我國數據產量達8.1ZB,同比增長22.7%,全球占比達10.5%,位居世界第二。其中,農業數據的增量更是達到了50%至80%的水平。在環境氣候、基因組測序、作物生長指標、地方統計等方面,種業從來不差數據。
在會議現場,張學才提出了一個有趣的觀點:“數據并不是越多越好”。
他提到,測序數據越多越好,標記數量則不一定越多越好,算法也不一定越高級越好。對育種的人來講,數據庫能否承受存儲和計算的壓力,讓人覺得你不是在玩數據,你是來實踐做育種,這才是最重要的。
每天都有源源不斷的數據產生,在某些方面,也給育種家造成了困擾。
韓志國表示,大家在做表型采集時常常有不同的命名方式,這給大數據處理增加了難度。同時,不同的表型平臺的信息化難以打通,很重要的一點在于表型的數據實在太大。
我們也一直在尋找表型數據領域更簡化的指標,從而助力育種和關鍵的種植流程決策連接起來,這個或許會成為產業化落地應用的關鍵點。
張學才強調,育種是一個龐雜的過程,其中牽扯到標準化和系統化問題。包括命名格式的統一、流程的優化、頂層設計的完善,都需要遵循科學性原則。當每一粒種子有了清晰的ID,包括來源、年份、名稱等;當每家育種信息系統的底層框架達成一致,數字育種才能真正成型。
到那時,再復雜的數據輸入和輸出也會變得簡單、高效。
寫在最后
作物育種猶如建房子,正在由“建平房時代”進入“建高樓時代”。雖然平房和高樓其房間的功能變化不大,但其建設的流程和工藝已有天壤之別。
未來的育種,將是“設計育種”,需要有科學的規劃,優良的設計,精細的施工,完善的監理,嚴密的檢測,出色的管理,高效的協作,缺一不可。
這兩段話由我國著名水稻育種家劉定富老師所說。今天,它也出現在了由極智生物、天豐智慧、慧諾瑞德三家企業共同發起的數字種業聯盟的規劃書上。這些文字正是關于聯盟成立初衷、所追求事業最為形象與深刻的說明。
未來,在聯盟的助力下,我們也期望一代又一代育種家的終極夢想能從紙面躍至現實。