為什麼我的論文被標記為抄襲？！深入探討相似度降低

最近，我們看到學術稿件中語言相似度降低的需求日益增加，這是由於使用基於人工智慧的軟體平台，目的是檢測學生和研究人員提交的作品與先前發表文本之間的相似性。

這些工具如何運作？

兩個最常用於檢測稿件相似性的軟體平台是 Turnitin 和 Crossref/iThenticate。

Turnitin 更常用於評估學生的課程作業和論文。該軟體將稿件與大型線上學術出版物資料庫（例如文章、書籍、網站、論文）進行交叉檢查，並將識別出的任何相似之處標記為潛在的抄襲行為。

Crossref 更常被研究人員和學術出版商使用。其相似性檢查服務基於 iThenticate 工具，該工具最初由 Turnitin 開發，運作方式類似，用於檢測提交文件與大型線上出版物資料庫中作品之間的潛在相似性。

可能會認為相似度分數表示論文被抄襲的百分比，這似乎是合理的假設。然而，這是一個過於簡化且錯誤的假設。根據 iThenticate 關於其介面產生的相似度報告的使用者指南：

「相似度分數僅僅是提交文件中與其他來源匹配的文本百分比」

換句話說，僅僅因為一篇論文獲得高相似度分數，並不意味著它包含抄襲。

根據 iThenticate 的說法，「提交的文件與我們資料庫中的某些內容匹配是完全正常的」。使用者指南建議作者和出版商僅將報告作為審查期間的起點，並建議應使用良好的判斷力來確定是否確實發生了學術不端行為。

當提交進行相似性檢查時，長篇文件可能僅因文本量大以及常用術語和措辭結構的不可避免重複而獲得高分。

此外，文內引用和參考文獻列表直接從來源複製到文件中，在與文獻資料庫進行交叉檢查時將自動被標記為「相似」。

AsiaEdit 經常收到協助作者的請求，他們的作品獲得了高相似度分數，如下圖所示。

我們發現，這些分數大多是由於許多小的、任意的事件造成的，定義為相似度分數為 1% 或更低的事件，而不是真正值得關注的大型事件。

這些報告中標記的大部分實例是常見模型和理論的名稱：例如，一份提交給我們審查的稿件將「健康信念模式 the health belief model（HBM）」和「技術接受模式 the technology acceptance model（TAM）」標記為與其他文獻相似的實例。

許多其他實例涉及技術描述：例如「我們以 x 軸為基準」或「組織切片通過分級乙醇系列脫水」幾乎沒有替代方案。

還有其他事件涉及常見措辭，例如「本研究通過提供……為文獻做出貢獻」，被標記為與其他已發表作品中的語言高度相似，甚至包括不可避免的短語，如「和」或「由於」。

在我們審查的一份此類報告中，23% 的總分是近 400 個離散「相似」單位的累計總和，其中沒有一個超過 1%，大多數遠低於 1%（即可忽略不計）。

我們審查報告以及相關文件，並提供摘要報告提交給審稿人/出版商，在適當的情況下反駁抄襲指控。

我們提供保證/證明，證明您的文件已經過檢查。

如果您想討論本文中的任何問題，或有文件希望我們檢查，請透過 cs@asiaedit.com 與我們聯繫。

我們是亞洲領先的學術編修合作夥伴。於1996成立，總部設於香港，通過超過 25 年的按時交付優質工作，與該地區的學者和知名教師建立起密切的聯繫。

雙週度的電子報，為您帶來我們最新的免費研究新聞和寫作資源（Blog文章、影片、線上講座）和折扣優惠。