黃金價格-使用澳大利亞去除醫療保險和PBS開放數據進行重新識別

行使公知的信息,墨爾本大學的一組研究職員宣稱在一個凋謝的醫療數據集中從新辨認了七位有名的澳大利亞人。該數據集包括十分之一澳大利亞人(約290萬人)的汗青縱向醫療賬單記載,已經被墨爾本大學的一個團隊發明可以從新辨認,個中包含生養以及接收內科手術的業餘活動員等信息。修復危險常常地下。由Chris Culnane博士,Benjamin Rubinstein博士以及Vanessa Teague博士構成的團隊忠告說,他們指望與當局持有的其餘數據相似的效果,如生齒普查數據,稅務記載,生理康健記載,刑事數據以及Centrelink數據。

“咱們發明患者可以經由過程將記載的未加密部門與小我私家的已經知信息(例如醫療法式以及出身年份)聯系起來,在沒有解密的環境下從新辨認患者,”Culnane博士說。
“這顯示了往辨認掉敗的驚人的地方,凸起了數據同享以及隱衷之間的危害均衡。”
固然發布的數據集對醫療事宜的日期進行了為期兩周的擾動,但該團隊透露表現,增長擾動并沒有太大的區分,由於例如,在從新辨認年長母親或者奇特法式的環境下,數據特別很是少指向依稀。
“團體而言,包含臨蓐,活動毀傷以及單次手術的從新辨認,咱們設計了43個查問并找到了7個奇特的競賽,”該團隊說。
該團隊透露表現,跟著信用卡汗青等其餘數據的浮現,愈來愈輕易創立人們的指紋,并且可能會產生在私家醫療保險公司外部,人們也不會曉得。
“一家私家醫療保險公司(例如)可以經由過程數十年的數佔有效地跟蹤已往客戶的醫療記載,或者從當前客戶那里取得他們不相識的額定信息,”他們說。“這將明明違背隱衷,可能永久不會被報道,縱然數據可能致使將來小我私家的無害決定。”
該團隊忠告說,發布帶有小我私家信息的數據集的成績在于,它可以在將來使用,而其餘泉源的其餘信息可以從新辨認職員。
該團隊寫道:“應當加倍細心地思量關于人的數據。”“縱然是最理智以及善意的往辨認指南也不太可能保障實用于敏感數據的隱衷珍愛,例如MBS / PBS 10%樣本,同時保留數據的有效性。”
“行使大數據的上風而不重大損害隱衷是咱們這個期間最難題的工程挑釁之一。”
該小組透露表現,2016年12月,衛生部已經收到無關數據集成績的關照。
2016年9月,墨爾本大學團隊發明雷同的數據集未精確加密提供商朝碼。該數據集隨后被衛生部撤下。
“脫漏了一些算法細節并沒有保障數據寧靜 – 若是咱們能在幾天內對細節進行逆向工程,那么其餘人也可能會如許做,”該團隊那時透露表現。
“經由過程冷靜無聞的寧靜步伐不起作用 – 堅持算法的神秘不會使加密寧靜,寧靜研究職員消費更長的時間來確定成績。
“找到并辦理這些成績遙比疏忽這些成績要好得多。”
由于發明的成績,客歲10月,澳大利亞當局提議點竄“隱衷法”,將成心識地從新辨認以及表露往辨認的聯邦數據集定為刑事犯法,撤消舉證義務,并追溯實用從2016年9月29日起。
依據這些轉變,任何以意從新辨認聯邦機構的往辨認數據集的人都可能面對兩年的囚系,除非他們在大學或者其餘州當局機構事情,或者與聯邦當局簽定許可此類事情的條約要進行。
該團隊在周一頒發的論文中寫道,該提議的立法將對研究發生冷蟬效應,并有可能確保凋謝數據失去恰當珍愛。
“固然凋謝數據不是發布此類數據的寧靜要領,但凋謝當局是決定內容的精確范例,”該團隊透露表現。
“有一件事是一定的:地下發布往辨認數據并不是敏感單元記載級數據的寧靜辦理方案。”
衛生部奉告ZDNet,它不曉得經由過程數據集辨認出任何人。
“這件事可以追溯到2016年,從當時起,澳大利亞當局已經采取進一步步伐來珍愛以及治理數據,”該部分談話人說。“該項目已經遏制并依然遏制,數據集立刻被刪除。
“該部分正在與墨爾本大學互助,并已經采取舉措改良其流程。”
澳大利亞信息專員辦公室(OAIC)透露表現,它已經于2016年9月最先考察,并且正在進行中,不會對隨后的成績頒發談論。
“該委員會將在考察收場時頒發地下聲明,”OAIC說。