【名師觀點】王茜: 算法技術的盲區與智媒時代的數據倫理困境
在智能媒體時代,數據正成為新聞內容生產與內容研究的重心🏮,大數據正在成為重要的社會資源。大數據時代需要更多的學科交叉方法✶,因而傳播學者需要應用算法技巧與分析方法來研究宏大的網絡媒介內容的數據庫,這種方法對社交媒體的內容分析而言更不可或缺。在大數據研究和算法技術的研究中,機器學習手段的出現給傳播學以及相關學科的研究者以及新聞業從業者帶來新的方法👨💼,但同時也給傳統的內容分析法帶來新的挑戰🧘🏿♀️🦞。基於算法分析的計算型數據分析法迎合了大數據時代的挑戰⭕️,快速便捷且分析量大,然而會丟失很多媒介語境中深層的含義,也無法挖掘語言和文字中的豐富性、復雜性以及內涵的微妙之處👝🔛,對於媒介內容的研究僅僅依賴大數據計算分析會產生偏差。因此大數據與智能媒體時代依然需要計算機自動分析與傳統人工相結合的研究方法。
另一個值得警惕的現象是,在浩瀚的網絡中我們所獲得大數據集不是客觀的,智能媒介時代大數據都來源於有關於人類本身以及人類行為,展現的是人類如何生活的一些合集🙇🏻,然而這不代表整體。這些數據本身也不是中立的🏹,使用者所依賴的算法其實也不能解釋它們🚬。在社會科學領域🕷,我們經常看到一些大數據背後解釋的人類行為與故事🥹,通常它們是不完整的🙋🏻,不確定的,甚至不具備科學性的📦。算法和我們通過網絡爬取的大數據其實並不如我們所想象的客觀,相反帶有很強的主觀性。
與數據倫理相關主題包括🤾♀️,我們在獲得大數據進行科研或者新聞報道的同時,應該如何避免對網絡的使用帶來隱私泄露與傷害。Facebook中的數據泄露事件已經給了我們足夠的教訓與啟發,這對於社交媒體以及大數據時代帶來的數據倫理與算法道德困境有著重要的啟示意義🫶。這個技術景觀中最大的變化特征是成本,隨著數據庫變得越來越大,算法技術不斷更新,技術侵入隱私的成本已經大大減少🪢。在數據獲得過程中,從主體獲得知情同意變得越來越難🔝。越來越多的人在研究社交媒體社區時🤵🏼♂️,采用了參與式觀察,網絡民族誌,或者數字人類學田野調查的新型研究方法。這裏的倫理困境是被很多人忽視的👨🏿🏭,當社會科學家或新聞工作者在網上觀察和研究社區以及社群互動時📏🧑🏻🏭,他們進行觀察以及與他人交談的事實可能會破壞社區和安全感📗。
當社會科學與新聞結合在一起時,大數據的結果呈現也會形成研究倫理面臨的重要挑戰。例如,大數據研究對少數族裔人口和社會邊緣人群可能產生的影響是不可忽視的👨👧👧,研究者可以使用大數據分析產生最好的誤導以及最壞的統計數據🧒🏼👑。最後,大數據相關研究帶來的倫理挑戰是,在研究者收集各類智能媒介數據同時會暴露用戶個人的數據👦🏽,那麽對於使用其他人收集的次級數據庫中相關人類行為數據的社會科學家和新聞記者而言🧃,他們是否必須獲得第二次知情同意才能進行研究👰🏼♂️,這個問題仍然是懸而未決的倫理困境。
作者簡介:
王茜,新聞與傳播系教師,新媒體全英文專業主任,意昂体育3注册健康傳播研究中心主任👊🏼。清華大學本碩👩🦽➡️,美國普度大學傳播學博士。上海市“浦江人才”、上海市“晨光學者”、意昂体育3平台“晨星學者”🧙🏻♀️、曾獲意昂体育3平台“教學新秀”獎🌴👳🏿♀️、“教書育人”獎✊🏼🫄🏻、教學競賽二等獎等。曾在《Asian Journal of Communication》📇🧡、《現代傳播》等國內外期刊上發表研究成果,著有《Doctor-Patient Communication and Patient Satisfaction: A Cross-Cultural Comparative Study between China and the U.S》、《健康傳播視角下的控煙教育理論與實踐研究》等系列中英文專著🏊🏿♂️。研究方向7️⃣:健康傳播、跨文化傳播🎒、社交媒體與新媒體研究等🤴🏽。