谷歌上線“新型冠狀病毒公共數(shù)據(jù)集”,可免費(fèi)使用到9月15日
開(kāi)放可獲取、完整、細(xì)顆粒、及時(shí)、可機(jī)讀、結(jié)構(gòu)化數(shù)據(jù),對(duì)疫情防控尤為重要。
疫情防控,科技公司一直在行動(dòng)。
在全球疫情蔓延的情況下,3月31日,谷歌啟動(dòng)了一項(xiàng)名為“COVID-19 Public Datasets(新型冠狀病毒公共數(shù)據(jù)集)”的項(xiàng)目,托管一個(gè)與疫情相關(guān)的公共數(shù)據(jù)資料庫(kù),并免費(fèi)向外界開(kāi)放,用戶可以自由訪問(wèn),以及自由分析其中的數(shù)據(jù)信息。
“COVID-19 Public Datasets”是什么?
據(jù)項(xiàng)目官方解釋,“COVID-19 Public Datasets”中的數(shù)據(jù),囊括了JHU CSSE(約翰·霍普金斯大學(xué)系統(tǒng)科學(xué)與工程中心)數(shù)據(jù)集、世界銀行的全球健康數(shù)據(jù)和OpenStreetMap數(shù)據(jù),它們都被存儲(chǔ)在了Google Cloud 上,并帶有“COVID-19 ”標(biāo)簽,研究人員可以免費(fèi)訪問(wèn)和查詢,并通過(guò)BigQuery ML服務(wù)(一個(gè)完全托管的數(shù)據(jù)倉(cāng)庫(kù))直接在內(nèi)部使用這些數(shù)據(jù)訓(xùn)練高級(jí)機(jī)器學(xué)習(xí)模型,直至2020年9月15日。
谷歌方面表示,“COVID-19 Public Datasets”的啟動(dòng)是為了更好的為‘以教育和研究為目的’的工作者提供賦能服務(wù),我們不會(huì)加入或管理PHI(一個(gè)致病菌的數(shù)據(jù)庫(kù))或PII(個(gè)人驗(yàn)證信息)數(shù)據(jù),希望盡最大努力阻止疫情蔓延。
不過(guò)需要注意的是,如果用戶要將“COVID-19 Public Datasets”和其它非新冠病毒數(shù)據(jù)集結(jié)合使用,那么BigQuery Sandbox將以字節(jié)為計(jì),在每月的免費(fèi)額僅有10GB存儲(chǔ)空間和1TB查詢空間之外,超出部分則按量收費(fèi)。
疫情之下,開(kāi)放數(shù)據(jù)集意味著什么?
數(shù)據(jù)統(tǒng)計(jì)顯示,截至到昨日下午2點(diǎn),全球COVID-19病毒確診感染人數(shù)已超72萬(wàn)人,死亡人數(shù)達(dá)3.4萬(wàn)人。
但與此同時(shí),正因數(shù)據(jù)量龐大、分散,研究人員面臨著極高強(qiáng)度的數(shù)據(jù)分析工作。除此之外,數(shù)據(jù)信息的不完整和部分不公開(kāi),也在一定程度上讓大眾對(duì)疫情了解不夠全面。也因此,開(kāi)放可獲取、完整、細(xì)顆粒、及時(shí)、可機(jī)讀、結(jié)構(gòu)化數(shù)據(jù)尤為重要。
此前,為加強(qiáng)全球疫情防控聯(lián)動(dòng),多個(gè)科技界、學(xué)術(shù)界機(jī)構(gòu)便聯(lián)合推出了一個(gè)公開(kāi)數(shù)據(jù)集“CORD-19”,其中涵蓋了截至3月13日之前的近3萬(wàn)篇新型冠狀病毒相關(guān)論文,以及針對(duì)文本進(jìn)行優(yōu)化的文本處理工具包SciSpacy、在科學(xué)文本上進(jìn)行預(yù)訓(xùn)練的BERT模型SciBERT、開(kāi)放研究語(yǔ)料庫(kù)和API等。
而針對(duì)谷歌的“COVID-19 Public Datasets”數(shù)據(jù)集,Descartes Labs的工程主管Sam Skillman評(píng)論稱,“谷歌在BigQuery中開(kāi)放并提供COVID-19數(shù)據(jù)將極大的推動(dòng)研究人員進(jìn)行數(shù)據(jù)分析,特別是免費(fèi)查詢服務(wù)的推出,會(huì)吸引更多人參與到這一項(xiàng)目中來(lái),這對(duì)全球數(shù)據(jù)共享、提升數(shù)據(jù)分析能力、普及病毒信息非常有幫助!

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
圖片新聞
-
ChatZOC,藏在口袋里的「眼科醫(yī)生」
-
金百澤科技亮相中國(guó)國(guó)際醫(yī)療器械博覽會(huì) | 盡顯醫(yī)療領(lǐng)域硬實(shí)力
-
進(jìn)階的新冠疫苗 又一個(gè)中國(guó)造
-
“AI醫(yī)療第一股”鷹瞳科技上市首日即破發(fā)
-
圓心科技登陸港股,“賣藥的生意”還好不好做?
-
十圖解讀2021年中國(guó)康復(fù)醫(yī)療行業(yè)現(xiàn)狀
-
醫(yī)藥流通數(shù)字化運(yùn)營(yíng)實(shí)現(xiàn)精細(xì)化飼養(yǎng)
-
科學(xué)家發(fā)現(xiàn)人體新器官:將有助于癌癥治療
最新活動(dòng)更多
-
即日-9.20點(diǎn)擊報(bào)名>>> 【免費(fèi)試用】宏集運(yùn)輸沖擊記錄儀
-
即日-12.31立即下載>> 【限時(shí)下載】《2025激光行業(yè)應(yīng)用創(chuàng)新發(fā)展藍(lán)皮書(shū)》
-
精彩回顧立即查看>> 高價(jià)值貨物的‘?dāng)?shù)字保鏢’:沖擊記錄儀重塑貨運(yùn)安全與效率
-
精彩回顧立即查看>> 【在線研討會(huì)】解析安森美(onsemi)高精度與超低功耗CGM系統(tǒng)解決方案
-
精彩回顧立即查看>> 【在線會(huì)議】CAE優(yōu)化設(shè)計(jì):醫(yī)療器械設(shè)計(jì)的應(yīng)用案例與方案解析
-
精彩回顧立即查看>> 全數(shù)會(huì)2025(第六屆)機(jī)器人及智能工廠展
- 1 創(chuàng)新藥的牛股們
- 2 互聯(lián)網(wǎng)醫(yī)療平臺(tái)謀變,押注AI爭(zhēng)奪下一個(gè)十年
- 3 翰宇藥業(yè)利潤(rùn)暴漲超1470.82%背后,新藥研發(fā)或在成為“數(shù)字黃金”
- 4 百濟(jì)神州總算出了口惡氣
- 5 中國(guó)血液腫瘤藥物巨頭起勢(shì),一場(chǎng)新盛宴的開(kāi)始
- 6 創(chuàng)新藥為何又集體沖高?
- 7 重磅!復(fù)宏漢霖引進(jìn)啟德醫(yī)藥臨床III期創(chuàng)新HER2 ADC
- 8 13億美元!禮來(lái)與Superluminal合作開(kāi)發(fā)小分子心臟代謝和減肥新藥
- 9 AI醫(yī)療與創(chuàng)新藥齊熱,京東健康在押什么注?
- 10 長(zhǎng)春高新需要新敘事