美國研究人員測試IBM與微軟等業者推出的臉部識別技術準確度後發現, 接受測試的服務在白膚色人種上準確度較高, 黑膚色人種準確度偏低. 報告指出, 其原因在於原始訓練演演算法上黑膚色人口較少. 專家也呼籲, 業者在目前識別技術準確度資訊上應更加透明. 據Wired報導, 研究人員測試過微軟與IBM識別照片上性別的臉部分析服務, 結果發現上述公司演演算法在識別較白膚色的男性準確度接近百分百, 但分析黑膚色女性時則經常出錯, 其原因在於, 利用機器學習技術打造臉部分析演演算法的訓練數據中較黑膚色較少. 過去Google的照片分類服務便曾將黑人標示為黑猩猩而令外界詫異, 因此, 如何確保部署在消費性產品, 商用系統與政府程式的機器學習系統無虞, 已是人工智慧(AI)領域重要討論課題. 2016年喬治城大學(Georgetown University)報告曾指出, 已被FBI與各地警察局部署的臉部識別技術的準確度在非裔美國人上偏低. 在這次新的研究, 麻省理工學院(MIT)研究人員Joy Buolamwini與微軟研究人員Timnit Gebru則在識別系統中投入1,270張歐洲與非洲國會議員的相片, 而且是利用費式量表(Fitzpatrick scale)分類系統. 這次相片集被用來測試微軟, IBM與大陸新創公司Megvii旗下Face++識別臉部的雲端服務, 研究人員鎖定在3種服務的性別偵測功能上. 結果發現這3種服務在男性臉孔準確度比女性高, 較白膚色比黑膚色來得佳, 所有服務對於擁有較黑膚色的女性上, 準確度都不高. 微軟在識別膚色較白男性時全答對, IBM錯誤率則為0.3%, 但在識別較黑膚色女性時, 微軟錯誤率為21%, IBM與Face++都為35%. 評論指出, 提供隨選機器學習演演算法的服務已成為大企業競爭的熱區, 微軟, IBM, Google與亞馬遜(Amazon)都宣傳雲端是適合從語法上分析影像與文字意義等任務來作為諸如運動, 醫療與製造業引進AI能力的途徑, 但是同時, 客戶卻也可能得被迫接受其局限. 針對視障民眾開發智能眼鏡的新創公司Pivothead便是利用微軟AI服務的客戶之一, 不過, 微軟的技術檔案中指出, 性別識別以及其他情緒和年紀等臉部特徵目前都屬於實驗性, 並非完全準確. 對此, 前美國總統歐巴馬(Obama)任內的首席資料科學家DJ Patil指出, 這次報告凸顯, 科技公司必須確保其機器學習系統在所有種類人類上適用的重要性, 而且業者也必須針對其服務仍存在限制一事更加公開. 微軟目前在重視機器學習道德議題上則努力扮演領導的角色, 該公司許多研究人員正投入該領域並成立內部AI與工程及研究道德委員會(Aether). 該單位在2017年曾參與稽核工作, 發現微軟分析臉部表情的雲端服務在兒童上表現欠佳.