免費論文查重認準CNKI論文查重,專為高校論文檢測、畢業論文查重、碩士論文查重誕生的論文檢測入口平臺,CNKI論文查重系統涵蓋海量的數據庫,為畢業生解決各種煩惱,論文查重軟件免費為各種有論文檢測、論文查重需求的人提供,論文查重認準CNKI查重!
發布時間:2021-04-30 11:00:02 作者:知網小編 來源:www.elxoepd.cn
在
1背景下電子文檔易于保存,可以進行檢索和維護,現在高中生提交的實驗報告已從紙版逐步轉移到電子版。電子文檔帶來方便的同時,對學生的剽竊也非常方便。為了防止
名學生的實驗報告書的復印現象和教師的報告書的批改,需要人工總結分數,統計提交情況。這些工作需要時間,容易出錯。教師需要有效的論文調查和統籌工具。減輕負擔,把寶貴精力投入更有意義的工作中。但是,市場上的搜索軟件主要用于調查論文。收費,不能調查班級內的抄襲情況。
為了解決上述問題,設計了針對高中電子版實驗報告特征的桌面軟件,輔助實驗報告的管理,實現了班級內檢查重量、合計分數和統計不足狀況。結果自動excel形式引導,有效降低教師實驗報告管理工作工作量,杜絕學生抄襲現象,促使學生認真完成實驗,單獨寫實驗報告。2主要技術介紹2.1余弦相似性算法余弦相似性算法。這是計算文本類似度的最常見的算法。余弦類似度在計算文本的類似度時,首先需要將文本分詞,計算詞數,然后文本可以用詞數矢量表示,通過計算兩個矢量之間的夾角余弦值來測量矢量之間的類似度[1],并將文本的類似度的計算效果非常好,廣泛應用于文本類似度的計算[2]。公式1中顯示了
種計算方法。例:A:安徽省合肥市B:安徽省安慶市通過NLPIR漢語分詞系統計算單詞的頻率,得到:安徽省合肥市安慶市A:[1,1,0]B:[1,0,1],AB的類似度為0.5。2.2NLPIR漢語分詞系統采用了中國科學院的NLPIR漢語分詞系統[3],在實驗報告書中進行分詞,NLPIR根據交叉信息熵算法,能夠自動計算并提取關鍵字,實現了自己的適用分詞和表記詞性,因此是斯特分詞的非二選一,被廣泛認可并被應用。
.POI本系統將appache放入POI中讀寫操作word,POI支持office2003、2007、Excel2003和2007[4]。apache的開發團隊一直在更新POI進行維護。功能豐富、完善。這些hwpf模塊可以實現字的doc文件的讀寫操作。
xwpf模塊可以實現word的docx文件的讀寫動作[5]。本系統正在處理docx文件。使用xwpf模塊,讀寫操作包含若干重要對象。在這里簡單介紹一下。XWPFDocument的對象表示docx文檔。
XWPFDocument由以下幾個重要對象組成。這里是XWPF?Paraph對象表示文檔中的段落。XWPFRun對象表示具有相同屬性的文字。XWPFTable對象表示文檔中的表格。
XWPFTableRow表示表格中的一行。XWPFTableCell支持表格單元格。
3系統設計3.1系統功能模塊設計系統主要由五個模塊構成,維護學生信息管理和實驗報告模板管理兩個模塊的基本信息,檢測不足列表,匯總重量檢查和成績運行三個模塊提供基礎數據。系統功能構成如圖1所示。
.3.2數據庫設計采用開源數據庫MySql保存學生、班級和實驗報告的模板信息。具體表格的定義如下。4系統的核心功能讀取4.1實驗報告內容,要求學生匯總實驗報告并提交docx文件,POI可以以XWPWordExtractor和XWPFDcument兩種方式讀取docx文件。XWPFWordExtractor內部也參照了XWPFDcument,但只能得到簡單的文本內容和文檔屬性,無法獲得文檔內容的屬性。因此,系統可以使用XWPFDcument對象獲取文本內容的正確屬性信息。
以下使用XWPFDcument巡回XWPF石板,閱讀實驗報告書的主要代碼。4.2檢查列表可以指定類。或選擇學生列表的Excel。選擇文件,選擇工作所的文件夾,根據工作文件的命名格式提取學名和名字,與系統中存儲的班級學生進行核對,檢測沒有提交作業的學生,制作缺席名單。一部分的實現代碼如下。4.3報告的復查報告在本班范圍內進行,對各學生的報告和其他學生的報告進行類似性檢查,對類似度大于設定閾值的報告填寫復查報告。
具體實現過程:第一步:選擇重類、工作模板和實驗報告所的文件路徑。第二步:根據班上的號碼查學生信息,包括號碼、學號和姓名的第三步:循環學生名單,從指定的文件路徑找到學生的作業,讀取作業內容。對內容進行分詞處理,計算詞匯,循環結合后生成詞匯矩陣。
第4步驟:用余弦算法計算這些詞數向量之間的類似度,生成類似度矩陣。步驟5:縮小大于閾值的作業,生成檢索結果文件。4.4報告成績的導出電子實驗報告中,通常文件的最后一行有評分位置,一般設定得分關鍵字,測試數據設定“得分(百分制)”。但是,有些學生在寫實驗文章的時候,會錯誤地刪除得分的關鍵詞,或者在得分后附上實驗數據。在這里事先約定。如果文檔中有得分,則在這里評分。否則,將在文檔的最后一部分評分。該模塊首先選擇工作模板,獲取得分鍵,讀取字文件,獲得所有段落的集合,然后依次依次檢查段落中是否有關鍵字。您可以使用正則表達式獲得分值。否則,取出文檔的最后一部分,提取其中的分值。
在Excel文件中生成最后總結的分數。5使用java語言在eclipse平臺上開發結束語系統,并通過POI提供的API來讀取word文檔的文本內容。采用中國科學院NLPIR中文分詞系統,對文本分詞用余弦類似度算法計算類似度,進行論文驗證。
系統實現了實驗報告書的欠納檢查,在該級別檢查報告內容的論文,制作論文的檢查報告,讀取報告的成績,制作Excel的匯總表。系統能有效協助教師的實驗報告管理,集中教師批改實驗報告。下一個工作想采用B/S模型實現報告書的在線提交。