知識產權和許可管理的挑戰(zhàn),導致代碼濫用或濫用風險。
1.面臨的挑戰(zhàn)
隨著開源軟件的蓬勃發(fā)展,以及人工智能技術的逐漸成熟,也為中國開源領域帶來了巨大的挑戰(zhàn)。 其一,大模型技術、開源、生成式AI、算力這些熱詞都是開發(fā)者最關注的技術突破方向。而更深遠的 問題,比如與隱私保護、日常生活息息相關的價值對齊、安全合規(guī)等問題,受關注度弱于其他技術突 破方向。這可能是因為很多人還未對「人工智能的潛在倫理風險」產生實感,這些情節(jié)暫時還存在于 電影之中。

隱私保護也逐漸成為一個不可忽視的挑戰(zhàn)。目前,以大模型產品為例,國內外諸多公司也遇到過因 “用公開數(shù)據(jù)訓練大模型”導致官司纏身,這也引發(fā)了巨大的爭議。開源AI領域需要處理大量的數(shù)據(jù),但同時也需要保護數(shù)據(jù)的隱私和安全性。隨著對個人數(shù)據(jù)使用的監(jiān)管加強,保護用戶隱私成為一 個重要挑戰(zhàn)。 根據(jù)CSDN發(fā)布的《AI開發(fā)者生態(tài)報告》顯示,在大數(shù)據(jù)時代,盡管數(shù)據(jù)量呈指數(shù)級增長,但獲取高 質量的數(shù)據(jù)、處理數(shù)據(jù)偏見、保障數(shù)據(jù)安全與隱私,以及有效利用數(shù)據(jù)進行創(chuàng)新研究等方面依然面 臨巨大挑戰(zhàn)。
其二,知識產權和許可管理的挑戰(zhàn),導致代碼濫用或濫用風險。開源軟件項目需要清晰的許可協(xié)議, 但有時會存在許可混亂或侵權問題,這引發(fā)法律糾紛和不確定性。 在過去一年里,也迎來了一則好 消息。2024年2月,最高人民法院發(fā)布了一則《這份判決給軟件開發(fā)者吃了定心丸》文章,最高法知 產法庭平衡保護軟件開源社區(qū)建設和軟件開發(fā)者權益受好評。“最高人民法院對案件的妥善處理, 合理地界定了GPLv2(開源協(xié)議)此類開源許可證軟件二次開發(fā)者的權利邊界,為我國正在建設有 中國特色的開源社區(qū)樹立了標桿,是我國軟件開發(fā)行業(yè)的重要里程碑,意義非凡。”這是良好的開 端。 其三,維護和支持的可持續(xù)性,一些項目缺 乏長期支持和資金,讓很多開源開發(fā)者面 臨生存問題,最終導致一些項目難以長期維 護,會停滯或廢棄,影響用戶和企業(yè)的可靠 性。在這一窘境下,52%的開發(fā)者稱自己沒 有在開源上獲得任何收入。
其四,安全性和漏洞管理。開源軟件雖然公開代碼,但并不保證免受漏洞和安全威脅的影響。不及時 發(fā)現(xiàn)和修復漏洞會給用戶和組織帶來風險,特別是在廣泛使用的開源項目中。調查數(shù)據(jù)顯示,46%的 開發(fā)者遇到過開源軟件相關的安全漏洞。

2.建議
基于以上挑戰(zhàn),開源開發(fā)需要包括政府、企業(yè)、社會組織以及個人開發(fā)者的積極參與和支持,以下是 一些建議和措施: (1)加強數(shù)據(jù)隱私與安全性 數(shù)據(jù)最小化原則:在項目中最小化收集和使用個人數(shù)據(jù)。只收集和使用必要的數(shù)據(jù),避免收集不必 要的個人信息。 用戶明示同意:在收集個人數(shù)據(jù)之前,確保獲得用戶的明示同意。用戶應該清楚地知道他們的數(shù)據(jù) 將被用于何種目的,并且有權選擇是否同意。 匿名化和脫敏:在可能的情況下,對收集的個人數(shù)據(jù)進行匿名化或脫敏處理,以降低數(shù)據(jù)關聯(lián)性和 識別性。 數(shù)據(jù)訪問權限控制:限制對用戶數(shù)據(jù)的訪問權限,僅允許有必要權限的人員或系統(tǒng)進行訪問,并建 立審計機制以監(jiān)控數(shù)據(jù)訪問情況。社區(qū)教育和意識提升:加強社區(qū)成員對隱私保護的意識,教育他們如何保護個人隱私,并提供相應 的培訓和資源。
(2)采用有效的方式更好地管理知識產權和許可證,降低法律風險 開源項目應該制定明確的知識產權政策,包括許可證選擇、版權聲明、貢獻者權利和責任等方面的 規(guī)定。這有助于消除不確定性,增加項目的透明度和可預測性。 選擇合適的許可證:選擇一個適合項目需求和目標的開源許可證是至關重要的。開源社區(qū)提供了 多種選擇,如MIT、GPL、Apache License等,每種許可證都有其特定的特點和限制。項目組織者應 該認真評估每種許可證的優(yōu)缺點,選擇最適合項目的許可證。 明確貢獻者的權利和責任:確保貢獻者清楚地了解他們的貢獻如何受到保護,并明確他們對項目的 貢獻的版權歸屬。這可以通過貢獻者協(xié)議或貢獻者許可協(xié)議來實現(xiàn)。 建立貢獻者指南和流程:提供清晰的貢獻者指南和流程,包括如何提交貢獻、如何報告問題、如何 進行代碼審查等。這有助于規(guī)范貢獻的方式,減少知識產權糾紛的可能性。 定期審查和更新許可證:定期審查項目使用的開源許可證,并根據(jù)項目的發(fā)展和需求進行更新。隨 著時間的推移,項目的需求和環(huán)境可能會發(fā)生變化,因此需要不斷地審查和更新許可證選擇。 采用自動化工具:使用自動化工具來管理知識產權和許可證信息,如軟件掃描工具、許可證管理工 具等。這些工具可以幫助識別項目中使用的開源組件和其相關的許可證信息,從而更好地管理知識 產權和遵守許可證要求。
(3)維護和支持的可持續(xù)性 多樣化的資金來源:探索多樣化的資金來源,包括個人捐贈、企業(yè)贊助、基金會資助等。建立穩(wěn)定 的資金來源有助于項目的長期發(fā)展和運營。 建立商業(yè)模式:考慮建立基于項目的商業(yè)模式,例如提供付費支持和咨詢服務、開展培訓和認證 等。通過商業(yè)模式來獲得收入,可以支持項目的持續(xù)發(fā)展和維護。 定期更新和維護:定期更新和維護項目,修復漏洞、改進功能、更新文檔等。這有助于保持項目的 活躍度和吸引力,增加用戶和貢獻者的參與度。建立社區(qū)參與機制:建立開放、包容的社區(qū)參與機制,鼓勵更多的人參與項目的開發(fā)和維護。這不 僅能夠分擔項目維護的壓力,還能夠增加項目的可持續(xù)性。
(4)使用內存安全編程語言 隨著技術的進步和需求的變化,開發(fā)人員逐漸意識到選擇適合的編程語言來減少內存管理的風險是 明智之舉。使用那些在設計時就注重內存安全的語言,可以通過自動內存管理、嚴格的類型檢查和內 置的安全特性,顯著降低了開發(fā)人員引入內存錯誤的風險。 例如,Rust通過借用檢查器和所有權系統(tǒng),確保在編譯時捕獲幾乎所有的內存錯誤;Go語言通過垃 圾回收機制有效地管理內存;Java同樣利用垃圾回收,確保對象的生命周期管理更加安全;Python和 Ruby則通過高層次的抽象和動態(tài)類型系統(tǒng),減少了內存管理的復雜度。Swift不僅為iOS和macOS開 發(fā)提供了強大的功能,同時也通過自動引用計數(shù)(ARC)來實現(xiàn)內存安全。
3.未來展望
隨著數(shù)字化轉型的不斷推進,越來越多的企業(yè)和組織意識到開源軟件的價值,其在削減成本、提高 安全性、推動創(chuàng)新和實現(xiàn)可持續(xù)性方面的優(yōu)勢日益顯著。開源開發(fā)者將繼續(xù)在推動開源和開源人工 智能領域發(fā)展中發(fā)揮重要作用。他們將繼續(xù)引領創(chuàng)新,推動技術進步,并積極參與社區(qū)建設,促進合 作和知識共享。

在AI維度,開發(fā)者眼中的發(fā)展機遇同樣豐富多彩,擁抱開源、出海與國際化、深耕模型技術、發(fā)力國 產替代、挖掘商業(yè)場景、加強數(shù)字化建設……這些都是亟待積極把握的多元化發(fā)展機遇。