她讓所有人輕鬆搜索和訪問全球基因組數據,重點是免費!

生物醫學 Illumina 大學 數據挖掘 動脈網 2017-04-07

試想一下,在一個平臺上就能實現全球基因組數據的搜索和訪問,是不是可以幫助研究人員輕鬆解決數據查找問題,從而提升基因組學研究的整體速度。

英國劍橋的Repositive就是這樣一個免費的在線平臺。Repositive集結了來自全球各地的基因數據資源,用戶通過這個平臺就可以實現數據資源的搜索和訪問。

她讓所有人輕鬆搜索和訪問全球基因組數據,重點是免費!

這樣一個操作簡單且輕鬆的平臺,可以幫助研究人員更有效的尋找到可靠的數據信息,不僅能夠幫助研究人員節省下大量數據挖掘的時間,還能幫助把這些數據的價值發揮到最大。

Repositive創始人兼CEO Fiona Nielsen畢業於南丹麥大學,曾是illumina的生物信息科學家,她認為精準醫學的成功與否,實際上取決於數據信息的價值。因此,她認為Repositive所做的信息挖掘工作,將有可能改變基因組學研究的現狀。

挑戰:數據訪問是主要瓶頸

在生物製藥領域,無論是大型企業還是小公司,通過基因組學數據去評估藥物風險和藥物開發價值是必不可少的一步。這一步,基因組學數據是基礎,這需要尋找到大量的基因組學數據集進行統計。如何獲得及時且有效的數據資源,對這些公司來說非常重要。

然而,對基因組學數據研究人員來說,這些數據的查找和訪問令人頭疼的問題。全球領域開展了基因組學研究不計其數,一方面積累了豐富的數據資源,但另一方面,這些豐富的資源也給信息的查找帶來了挑戰:這些資源要如何訪問?找到訪問入口後要如何從海量的信息中查找到自己想要的信息?

無疑,在這樣的模式下,信息查找是非常繁瑣、費時的工作。

Nielsen從事過一些學術和商業研究工作,這種糟糕的經歷她有過不少次。做了幾年研究工作後她發現,基因組學臨床解讀的瓶頸其實並不在分析算法和設備上,而是缺少一個真正準確可靠的數據資源和查找方案。

她讓所有人輕鬆搜索和訪問全球基因組數據,重點是免費!

Repositive創始人兼CEOFiona Nielsen

2013年12月,Nielsen做了個決定,她從illumina辭職,成立了慈善機構DNAdigest。Repositive就是DNAdigest的一個產品,希望通過幫助科研人員輕鬆實現基因組學數據的查找和訪問,以加速基因組學研究。

“我不是一個成功的科研人員。”Nielsen承認,“但我想我能做點其他的,讓有能力的科研人員做的更好。”

解決方法:數據資源整合

很多人想知道,在這樣一個數據資源整合平臺建立之前,科研機構是如何實現資源訪問的呢?現實中的科研工作並非像電影裡那麼炫酷,更多的是日復一日的試驗,記錄,重複。數據查找和訪問更是份枯燥且繁瑣的苦差。

事實上,目前各家數據資源的標準都不一樣。而要使用這些數據,首先要做的就是資源整合,把各家標準統一,工作量非常大。其次,全球範圍類的數據集合那麼多,要挨個去查找是極其麻煩的。如果要把所有的數據庫都扒一遍,即便是HGNC、OMIM以及Uniprot這些明星科研機構的科學家們,恐怕也得皺一皺眉。

這就造成了兩個現象:一是數據查找和訪問花費了研究人員大量的時間和精力;二是即使信息無處不在,但許多信息其實是被閒置的。

Repositive則可以一勞永逸的解決這些問題。通過Repositive,用戶可獲得多個知名的基因數據庫的訪問權限,這其中包括全球知名的數據庫,比如1000人基因組計劃和基因表達圖譜(Genome Expression Atlas);還有愛沙尼亞生物中心、GenomeAsia100K這些鮮為人知的數據源;甚至還包括了InSilico DB 和 Xpressomics這樣的企業數據。

目前,Repositive平臺上已經集結了全球範圍內超過100萬個數據集,數據量每個月都在擴大。Nielsen透露,他們的目標不僅僅是公共的數據資源,同時還要把世界各地的大型數據庫,科研機構、公司以及公益項目的數據也吸收進來。

據瞭解,Repositive已經與阿斯利康、默克以及未因生物等製藥巨頭和生物公司達成合作,將共同建立一個支持腫瘤研究的協同數據庫。該項合作的目的是為從PDX模型到特定環境的腫瘤研究,提供數據發現和訪問的入口。

她讓所有人輕鬆搜索和訪問全球基因組數據,重點是免費!

(PDX模型:The Patient derived xenograft,是一個功能強大的癌症研究模型,被廣泛應用於藥物發現和臨床藥物研究)

精準醫療是最大受益方

通過這樣一個數據平臺,受益最大的就是精準醫學領域。精準醫學根據個人的遺傳背景來尋找適合的治療方法,對疾病基因層面的認識是基礎。要從基因層面認識疾病,沒有強大且可靠的基因組數據資源,是無法實現的。

除了惠及各地的基因組學研究人員,Repositive也將為數據提供方帶來福利。通過Repositive,他們可以擴大自己數據資源的影響力,同時還能獲得更多的資源,推進科研研究。

在保證患者和數據捐贈者權益的前提下,Repositive希望向更多的研究人員提供數據訪問解決方案,以此將這些信息的價值最大化。

下一步,Repositive還希望像研究人員提供更多具有人口多樣性特點的數據,以保證研究結果的準確性和全面性。截止到2016年,Repositive已累計獲得融資1200萬美元。


本文作者周夢亞

動脈網(WeChat:vcbeat),關注互聯網醫療及健康領域的新技術、創業和投資,以及新技術背後的倫理變遷。

在動脈網公眾號後臺回覆互聯網醫療領域任意關鍵詞(如:人工智能、基因檢測),為您獨家提供相關前沿資訊文章!

版權聲明:動脈網所刊載內容之知識產權為動脈網及/或相關權利人專屬所有或持有。未經許可,禁止進行轉載、摘編、複製及建立鏡像等任何使用。