所屬欄目:電子信息期刊 熱度: 時間:
《中文信息學報》
關注()【雜志簡介】
《中文信息學報》于1986年創刊,是經國家科委批準,由中國科學技術協會主管,中國中文信息學會和中國科學院軟件研究所合辦的學術性刊物,是中國中文信息學會會刊。《中文信息學報》是《中文核心期刊要目總覽》自動化、計算機技術類的核心刊物。國內外公開發行。它及時反映我國中文信息處理的學術水平,重點刊登我國中文信息處理基礎理論與應用技術研究的學術論文,以及相關的綜述、研究成果、技術報告、書刊評論、專題討論、國內外學術動態等。從本刊刊登的文章中可以及時了解我國最新的中文信息處理水平和學術動向。所刊登的文章多數得到了國家或省、部級重大科技項目、攻關項目及自然科學和社會科學基金的資助。
【影響因子】
國家新聞出版總署收錄 該刊被以下數據庫收錄:
中國科學引文數據庫(CSCD—2005)
核心期刊:
中文核心期刊(2008)
中文核心期刊(2004)
中文核心期刊(2000)
中文核心期刊(1996)
【欄目設置】
主要欄目:綜述、研究成果、技術報告、書刊評論、專題討論、國內外學術動態等。
雜志優秀目錄參考:
現代漢語虛詞用法知識庫建設綜述 張坤麗,昝紅英,柴玉梅,韓英杰,趙丹,ZHANG Kunli,ZAN Hongying,CHAI Yumei,HAN Yingjie,ZHAO Dan
基于依存語法構建多視圖漢語樹庫 邱立坤,金澎,王厚峰,QIU Likun,JIN Peng,WANG Houfeng
詞匯計量研究與常用詞知識庫建設 俞士汶,朱學鋒,YU Shiwen,ZHU Xuefeng
面向計算的現代漢語雙音詞分離及其語法意義與特性研究 薛宏武,XUE Hongwu
漢語復合名詞語義信息標注詞庫:基于生成詞庫理論 宋作艷,趙青青,亢世勇,SONG Zuoyan,ZHAO Qingqing,KANG Shiyong
漢語語義場網絡中的無標度分布現象 楊華,姬東鴻,蕭國政,YANG Hua,JI Donghong,XIAO Guozheng
HowNet與CCD映射方法研究 向春丞,穗志方,詹衛東,XIANG Chuncheng,SUI Zhifang,ZHAN Weidong
信息動態
基于特征序列的語義分類體系的自動構建 陳剛,劉揚,CHEN Gang,LIU Yang
基于本體和依存句法的詞匯語義關系標注及評價方法研究 熊晶,支麗平,袁冬,XIONG Jing,ZHI Liping,YUAN Dong
內容標簽和關系標簽相結合的漢語篇章標注規范 王荀,李素建,王宇昕,WANG Xun,LI Sujian,WANG Yuxin
漢語篇章級小句關系的標注體系 吳云芳,徐藝峰,王愷然,WU Yunfang,XU Yifeng,WANG Kairan
基于圖式的文本蘊涵識別初探 倪盛儉,姬東鴻,NI Shengjian,JI Donghong
基于框架語義的隱式篇章關系推理 嚴為絨,朱珊珊,洪宇,姚建民,朱巧明,YAN Weirong,ZHU Shanshan,HONG Yu,YAO Jianmin,ZHU Qiaoming
教學與管理投稿:高校圖書館信息素質教育的研究思考
摘 要:現階段,在我國社會經濟發展水平快速提高的同時,信息技術的發展獲得了更大的發展空間。信息技術的應用領域逐漸擴大,尤其在高校圖書館信息素質教育方面發揮了重要的影響。如何根據高校圖書館信息素質教育的實際需求,合理的應用信息化技術,是高校未來發展中應積極思考的主要問題之一。本文將簡要分析,信息技術發展影響下的高校圖書館信息素質教育方面的內容,旨在更好的發揮信息技術在高校圖書館信息素質教育中的優勢。
關鍵詞:信息技術,高校圖書館,信息素質,教育
在高校教育發展的過程中,信息技術發揮了很大的作用。結合信息素質的相關定義以及其在高校教育事業中發展的成果證明,信息技術的應用使高校圖書館在培養人才素質教育中,始終扮演著重要的角色。信息技術的應用,為圖書館信息素質教育,提供了及其便利的條件。在信息技術不斷發展的今天,結合信息技術在高校圖書館信息素質教育中的應用問題,分析信息技術變革發展,制定高校圖書館信息素質教育策略,成為高校圖書館發展信息素質教育的關鍵事項之一。
中文信息學報最新期刊目錄
大語言模型微調方法研究綜述————作者:吳春志;趙玉龍;劉鑫;司念文;張魯飛;范昊;
摘要:近年來,大語言模型成為人工智能領域非常受關注的技術,引發了自然語言處理領域新的研究范式。在大語言模型訓練實踐中,參數微調是其中非常重要的一個環節,它允許用戶在資源受限條件下,通過調整少部分參數來提升模型理解用戶指令、解決下游任務的能力。該文全面回顧了2019—2024年間50余種主要的大語言模型微調方法,從全新的角度進行了系統性的整理和概括,分為全參數微調、部分參數微調、新增參數微調和無參數微調方...
報名通知|中國中文信息學會具身智能專委會(籌)首屆具身智能學術研討會
摘要:<正>具身智能是基于物理身體進行感知、認知和行動的智能系統,其通過智能體與環境的交互獲取信息、理解問題、做出決策并實現行動,從而產生智能行為,實現類人的通用人工智能。隨著大語言模型(簡稱大模型)的發展,大模型驅動的具身智能研究逐漸興起,其任務泛化能力和領域通用性,為具身智能的感知、推理和執行等研究帶來了技術突破的希望和可行性技術路線,近期的具身智能研究已經嘗試了大模型的調用和整合技術,并驗證了良好...
Step2Vec:面向動力學傳播的網絡表示學習方法————作者:陳奇;焦鵬飛;王震;鮑青;
摘要:網絡表示學習是對節點的網絡結構的一種分布式表示方案,目前被廣泛應用于節點分類、社團發現和邊關系預測等任務中。然而網絡表示學習對網絡傳播過程中節點狀態的估計仍是一個開放性的問題。經典的網絡表示學習方法在對該問題上的應用效果不佳,因此該文提出了基于動力學傳播的采樣方法,稱為Step2Vec逐步采樣方法。Step2Vec通過結合網絡傳播過程,對節點的網絡結構信息進行提取并訓練。該文分別將Step2Vec...
NCIFD:面向大模型的民族文化微調數據集————作者:羅鶴;張廷;孫媛;朋毛才讓;達哇才仁;
摘要:在大語言模型快速發展的挑戰下,民族文化研究及傳播需要更多的投入。其中,構建高質量的民族文化數據集不僅能促進民族文化傳播,還能提高大語言模型在特定文化環境中的精準度和適應性。為了構建高質量的民族文化指令遵循數據集,該文面向民族文化領域,收集整理了《中國民族百科全書》《中國服飾大典》等18本民族文化相關書籍,進行清洗過濾之后,基于Self-QA框架,使用大語言模型自動生成問答對。同時根據書籍的內容,人...
利用詞鏈提高文檔級神經機器翻譯的詞匯翻譯一致性————作者:雷翔宇;李軍輝;
摘要:近年來,各種上下文感知模塊的引入,使得文檔級神經機器翻譯(Document-level Neural Machine Translation, DNMT)取得了令人矚目的進步。受“一個語篇一個翻譯(one translation per discourse)”的啟發,該文在代表性DNMT模型G-Transformer的基礎上,提出一種有效的方法對源端文檔中重復出現的詞匯進行建模以緩解詞匯翻譯不一致...
一種預測未知節點的融合影響力最大化的知識可遷移GNN模型————作者:曾志林;張超群;吳國富;湯衛東;李灝然;李婉秋;
摘要:在社交網絡中,大多數節點的數據不完整,已有的方法對這些節點的預測效率較低。鑒于此,該文提出一種融合影響力最大化的知識可遷移圖神絡網絡(Graph Neural Network, GNN)模型VRKTGNN,其是對預測社交網絡未知節點的KTGNN模型的改進。VRKTGNN根據用戶的關注去構建一個圖結構數據,由改進的投票排名算法VoteRank++選出圖數據中影響力最大的節點對未知節點進行知識遷移,通...
基于多意圖融合框架的聯合意圖識別和槽填充————作者:尹商鑒;黃沛杰;梁棟柱;何卓棋;黎倩爾;徐禹洪;
摘要:近年來,多意圖口語理解(SLU)已經成為自然語言處理領域的研究熱點。當前先進的多意圖SLU模型采用圖的交互式框架進行聯合多意圖識別和槽填充,能夠有效地捕捉到詞元級槽位填充任務的細粒度意圖信息,取得了良好的性能。但是,它忽略了聯合作用下的意圖所包含的豐富信息,沒有充分利用多意圖信息對槽填充任務進行指引。為此,該文提出了一種基于多意圖融合框架(MIFF)的聯合多意圖識別和槽填充框架,使得模型能夠在準確...
基于詞性對齊與依存關系的中文排比句生成方法————作者:鐘茂生;劉蕾;吳如萍;甘家其;周新宇;
摘要:排比句是一種常用的修辭手法,其使用具有增強氣勢、強調突出、層次清晰的效果。排比句生成對于文本生成具有重要意義,能夠豐富文本生成的風格和形式,提升教育、廣告和文學創作的質量,但目前暫無生成模型和公開的排比句語料庫。為此,該文在收集和構建排比句數據集的基礎上,結合排比句具有的語言學特征,提出了一種基于詞性對齊與依存關系的中文排比句生成模型,稱為CPG-PosDep。模型從語言學出發,首先用設定的分詞、...
融合提示學習的故事生成方法————作者:倪宣凡;李丕績;
摘要:開放式自動故事生成旨在通過輸入故事的開頭、大綱、主線等,得到具有一致性、連貫性和邏輯性的故事。現有的方法想要提升生成故事的質量,往往需要大量訓練數據和更多參數的模型。針對以上問題,該文利用提示學習在零樣本與少樣本場景下的優勢,借助外部常識推理知識,提出了一種融合提示學習的故事生成方法。該方法將故事生成分為三個階段:輸入故事的開頭,常識推理模型生成可能的事件;根據類型不同,將事件填入問題模板中,構建...
中文動詞實現狀態數據集構建————作者:徐進;辛欣;
摘要:判斷動詞是否在現實中真實發生是自然語言理解中的重要問題,其不僅能夠為事件抽取等自然語言處理應用提供支撐,也有助于更深入地理解語言。雖然動詞實現狀態的辨析在英文領域已有一定的研究基礎,但中文領域的相關工作仍比較缺乏。一方面,中文動詞實現狀態缺乏標注規范;另一方面,缺乏相關的中文語料。針對目前中文動詞實現狀態缺乏標注規范的問題,該文在英文規范的基礎上,分析《人民日報》中文語料,結合時間提示詞、句式等信...
基于精調LLaMA模型的中西醫概念關系對比分析方法————作者:葉淋潮;邵會會;謝振平;
摘要:中醫知識的現代化與現代西醫學知識可以建立深度的互通互解。在大語言模型背景下,以傳統中醫和現代西醫的概念關系理解為切入點,該文提出一種基于精調LLaMA模型的中西醫概念關系對比分析方法。研究中,首先選定中西醫中一組相通的基本概念術語,并進行了相應的文本數據集構建;隨后基于LLaMA模型分別對兩個數據集進行精調學習,得到關于同組基本概念術語的兩個大語言模型;其次,基于基本概念術語集和兩個文本數據集,設...
基于標簽句子重構的多語言零樣本神經機器翻譯————作者:陳瀟;楊雅婷;董瑞;時現偉;馬博;吐爾洪·吾司曼;
摘要:針對當前多語言零樣本翻譯的標簽策略難以提供豐富的翻譯方向信息和模型對語言建模能力的不足,進而導致翻譯脫靶的問題,該文提出了使用標簽句子重構的多語言零樣本神經機器翻譯方法。具體而言,首先提出了一種詞級別的標簽策略,在編碼器端增加目標語言標簽嵌入,在源語言句子每個詞的嵌入表示中注入目標語言信息;其次設計了標簽句子重構任務,對句子添加噪聲和使用詞級別的標簽策略后進行重構操作,以達到增強模型語言建模能力的...
多級跨模態對齊的文本檢索視頻方法研究————作者:習怡萌;劉立波;鄧箴;劉倩;
摘要:現有文本檢索視頻方法在進行跨模態對齊時,未充分考慮文本細節和復雜視覺語義間的信息交互,使檢索性能受到影響。為解決此問題,該文提出一種多級跨模態對齊的文本檢索視頻方法。首先,將查詢文本按詞性進行分解并編碼,同時對視頻幀進行編碼和聚類操作;然后,對查詢文本和視頻的全局編碼進行對齊,獲取二者間的全局語義關系;接著,對文本動詞編碼與視頻子動作編碼進行動作對齊,以實現動作關聯;最后,將名詞編碼與經動作對齊篩...
《自然語言處理:基于大語言模型的方法》
摘要:<正>車萬翔郭江崔一鳴著劉挺主審推薦人孫茂松清華大學人工智能研究院常務副院長廖湘科中國工程院院士,國防科學技術大學計算機學院教授尼瑪扎西中國工程院院士,西藏大學信息科學技術學院教授李惠中國科學院院士,哈爾濱工業大學土木學院/計算學部教授2025年1月,DeepSeek(深度求索)公司開源的DeepSeek-R1模型引發全球關注——其通過純強化學習架構創新實現的自主推理能力,在數學、代碼及自然語言推...
基于孿生XLM-R模型的機器翻譯雙語平行語料過濾方法————作者:涂杰;李茂西;裘白蓮;
摘要:在機器翻譯中,模型訓練使用的雙語平行語料的數量和質量極大地影響了系統的性能,然而當前很多雙語平行語料是從雙語可比語料中利用自動過濾方法提取的。為了提高雙語平行語料自動過濾的性能,該文提出基于孿生XLM-R模型的雙語平行語料過濾方法,使用基于跨語言預訓練語言模型XLM-R的孿生神經網絡將源語言句子與目標語言句子映射到深層語義空間,利用平均池化操作獲得它們相同維度的句子表征,根據句子表征間余弦距離提取...
基于預訓練語言模型的IPC與高相似CLC類目自動映射————作者:黃敏;魏嘉琴;李茂西;
摘要:專利和圖書期刊是產業界與學術界的科技創新信息來源,專利通常采用國際專利分類法(International Patent Classification, IPC)標識,而中文圖書期刊則采用中國圖書館分類法(Chinese Library Classification, CLC),不同的分類標識體系給專利、圖書期刊信息整合共享和跨庫檢索瀏覽帶來了挑戰。針對IPC類目和高相似的CLC類目難以準確映射的問...
大語言模型故事理解能力評價數據集————作者:閆國航;郭亞鑫;譚紅葉;張虎;
摘要:故事包含大量的社會、物理等常識,同時蘊含深刻的道理,是知識傳播、文化傳承、價值塑造的重要載體。故事理解是NLP中的一項重要任務。近幾年,研究者對大語言模型(LLMs)的語言理解能力進行了很多評估與分析,但由于現有的故事理解數據集大多為答案出現于原文的實體類問題,因此對LLMs故事理解能力的評價與分析非常有限。為此,該文構建了一個寓言故事理解數據集CRMUS,并基于人類故事理解的認知過程:先進行常識...
中文大模型生成式摘要能力評估————作者:王俊超;樊可汗;霍智恒;
摘要:從傳統的紙帶機到當今大語言模型時代,自動文本摘要技術發展經歷了多次質的飛躍并不斷提升。但在中文摘要方面,由于其語言特點及敘述方式,機器生成的摘要難以與人工撰寫的相媲美。如今,眾多國產開源大模型均加強了對中文語料的訓練并展示出較為優秀的成果。為了評估這些開源大模型在中文摘要任務上的實際表現,該文篩選ChatGLM2-6B、Baichuan2-7B和InternLM-7B等中文大模型作為研究對象,在中...
面向垂直領域上下文特性的少樣本關系抽取方法————作者:任浩;李韌;楊建喜;肖橋;楊小霞;蔣仕新;王笛;
摘要:現有的少樣本關系抽取解決方案主要基于通用領域語料,尚未充分考慮垂直領域中存在的長文本、關系重疊等問題,面對垂直領域上下文時其關系抽取性能有待提升。針對上述問題,該文以橋梁檢測領域和醫療健康領域為背景,提出了一種面向垂直領域上下文特性的少樣本關系抽取方法。該方法首先通過預訓練語言模型RoBERTa_chinese_base對文本進行編碼,再分別在雙向長短時記憶網絡(BiLSTM)和實體特征提取模塊中...
自監督知識增強的零樣本文本分類方法————作者:林鑠浩;陳煒;萬懷宇;蔣致書;趙書源;廖夢祈;張芷毓;
摘要:為了改善零樣本文本分類任務中無標簽數據存在的類別不平衡問題,并充分發揮預訓練語言模型在該任務中的推理能力,該文提出了一種自監督知識增強的零樣本文本分類方法(Knowledge Enhanced Zero-shot Text Classification, KE0TC)。該方法利用提示模板引導大規模預訓練語言模型擴展類別標簽并構建知識圖譜,通過圖結構進行去噪和自監督數據生成;然后,采用段落采樣等方式...
相關電子信息期刊推薦
核心期刊推薦
copyright © www.anghan.cn, All Rights Reserved
搜論文知識網 冀ICP備15021333號-3