所屬欄目:科技期刊 熱度: 時間:
數據分析與知識發現
關注()《數據分析與知識發現》雜志簡介
《數據分析與知識發現》(月刊)創刊于1985年,是中國科學院主管、中國科學院文獻情報中心主辦的計算機信息管理技術方面的學術性刊物,是國內唯一一份被中國圖書館學會和中國科技情報學會共同推薦的專業技術類核心期刊�?镌O有“數字圖書館”、“知識組織與知識管理”、“情報分析與研究技術”、“應用實踐”、“動態”等一系列固定類欄目以及“特邀專欄”、“企業技術之窗”等不定期欄目。
《數據分析與知識發現》內容定位于廣泛吸納計算機科學、數據科學、情報科學以及數字科研、數字教育和數字文化等領域的技術與方法,研究數據驅動的語義計算、內容分析、數據挖掘、知識發現、智能管理和決策支持等方面的技術、方法、系統以及支撐設施、政策與機制等,尤其是聚焦從海量、異構、分布、動態、甚至富媒體數據中挖掘和發現知識以支持研究、管理和決策的理論、方法和技術。
《數據分析與知識發現》辦刊宗旨是聚焦各行各業中以大數據為基礎,依靠復雜挖掘分析方法,進行知識發現與預測、支持決策分析和政策制定的研究與應用,致力于提供理論指導、技術支持和最佳實踐。
《數據分析與知識發現》欄目設置
數學圖書館、知識組織與知識管理、情報分析與研究、應用實踐、動態、特邀專欄、金融證券管理、企業信息管理技術
《數據分析與知識發現》雜志榮譽
CSSCI 南大核心期刊(中文社會科學引文索引)(含擴展版)萬方收錄(中)上海圖書館館藏國家圖書館館藏知網收錄(中)維普收錄(中)中國期刊全文數據庫(CJFD)中國核心期刊遴選數據庫
2018年《數據分析與知識發現》雜志08期投稿論文目錄:
基于t-SNE降維的科學基金資助項目可視化方法研究陳挺;李國鵬;王小梅;
基于BRFSS數據庫應用人工神經網絡構建兒童哮喘預測模型馬曉宇;張晗;趙玉虹;
新一代知識問答平臺中提問者付費意愿的影響因素探究趙宇翔;劉周穎;宋士杰;
基于預警平臺大數據的事件旅游客流時空分布研究王玲;代前進;吳曉雋;
面向微博短文本分類的文本向量化方法比較研究李心蕾;王昊;劉小敏;鄧三鴻;
基于LDA和AdaBoost多特征組合的微博情感分析曾子明;楊倩雯;
基于領域本體的產品網絡口碑信息多層次細粒度情感挖掘何有世;何述芳;
跨設備搜索中設備轉移前后查詢式語義變化研究吳丹;陸柳杏;
等待感知對于移動信息產品用戶滿意度的影響研究——以數字小說書架為例馬艷陽;劉玉磊;徐伯初;支錦亦;
收錄論文:面向微博短文本分類的文本向量化方法比較研究
【摘要】:【目的】利用Word2Vec和Sent2Vec算法生成新浪微博的文本的向量化表示形式,以期在文本分類時獲得較低的計算成本和較高的分類效果�!痉椒ā渴褂梦谋局性~的0-1矩陣進行分類,將分類效果作為基準線;采用Word2Vec算法生成詞向量并用不同方式合成句子的向量表示,進行文本分類,并與基準線進行對比;利用Sent2Vec算法直接生成句子向量進行分類,綜合評價3種方法的優缺點�!窘Y果】研究顯示使用Word2Vec算法和Sent2Vec算法能夠極大程度上壓縮文本特征,對比于使用所有3萬多個詞作為特征,Word2Vec算法和Sent2Vec算法將特征數壓縮在1 000以內。在分類準確率方面,Word2Vec算法的分類準確率比基準線低約3%,準確率為75.14%。Sent2Vec算法的分類效果遠不如其他兩種方法,準確率只有63.08%�!揪窒蕖坑捎谡Z料有限,Word2Vec算法在計算詞向量時可能缺少足夠的語義信息,導致詞向量的準確性不高,而Sent2Vec算法在中文文本語境下生成句向量的分類結果較差�!窘Y論】Word2Vec算法更適用大規模語料文本分類,在文本量較少時應使用詞為特征分類。
數據分析與知識發現最新期刊目錄
基于重疊社區的謠言抑制最大化研究————作者:徐夢瑤;孫斌;江濤;崔家豪;
摘要:[目的]針對謠言抑制中對節點位置與社區重疊特性考慮不足的問題,提出一種謠言抑制框架RSM-OC。[方法]該框架創新地提出使用信任中心值來精準識別關鍵節點,結合重疊節點構成候選種子集,最后利用遺傳算法優化正種子節點集,并采用單向狀態轉換的線性閾值模型模擬謠言與真相的博弈。[結果]在四個真實數據集上的實驗顯示,RSM-OC方法相較于基線算法的謠言抑制率平均提升23.3%,真相傳播范圍平均擴大兩倍,特別...
考慮樣本語義特征與類簇結構特征的IDCCM文本深度聚類方法研究————作者:李婕;張智雄;
摘要:[目的]深度綜合關聯挖掘圖像聚類方法DCCM局限于基于樣本語義特征進行聚類,無法充分利用類簇結構特征中蘊含的具有高判別性的類間結構關系,制約了DCCM聚類性能的進一步提升。 [方法]本文提出融合類簇結構特征的改進模型Improved-DCCM。首先,以DCCM作為基礎聚類模型,引入基于高斯分布的文本數據增強策略,繼承DCCM的樣本語義特征挖掘能力。在此基礎上,通過樣本變量與類簇變量之間的互信息損...
生成式AI對話中的提示詞策略有效性探究————作者:周潔;王東毅;代沁泉;夏蘇迪;
摘要:[目的]本研究旨在探索普適的生成式AI有效提示詞策略,以提升用戶的交互技能和優化使用體驗。[方法]采用Q方法,邀請用戶根據其在通用場景、跨任務及跨模型的生成式AI使用經驗,對不同提示詞策略的有效性進行排序,從而識別出具有普適性的有效提示詞策略類型。[結果]研究發現,最有效的提示詞策略包括明確問題、明確目標和提供背景信息。普適性有效提示詞策略可分為三類:明確需求與精確指引型、清晰解釋與邏輯排序型、拆...
基于可解釋自適應加權Stacking集成學習的電影IP衍生品開發效果預測————作者:倪淵;李翔宇;張健;董飛星;
摘要:[目的]構建可解釋集成學習模型,為預測電影IP衍生品的開發效果提供新的決策方式。 [方法]基于價值鏈理論解析電影IP衍生品開發過程,構建預測指標體系�;贙LLB模型對影響因素進行提取篩選、構建預測標簽。提出基于AWStacking的開發效果預測模型。 [結果]以XGBoost、CatBoost、RF為基學習器,LR為元學習器的AWStacking算法預測效果最好,宏平均精確率為0.8699,...
基于多源數據間主題時序擴散網絡的研究前沿探測方法研究————作者:李廣;吳新年;寧寶英;
摘要:[目的] 設計基于多源數據間主題時序擴散網絡模型,進行動態計量數據源權重的研究前沿探測。 [方法] 通過分析前沿主題的時間、擴散和網絡特征,提出基于主題時序擴散網絡的研究前沿探測方法體系、指標體系和立體判別坐標圖,最后在人工智能領域進行實證分析。 [結果] 動態計量出多源數據權重(戰略規劃0.301、科技報告0.234、基金項目0.124、專利文獻0.122、會議論文0.113、期刊論文0.105...
基于時空圖結構學習與路線特征增強的行程時間預測研究————作者:潘曉;董慧;陳曉;
摘要:[目的]針對目前多任務行程時間預測研究中,存在的刻畫路段波及效應影響范圍的靈活性不足,以及在標注數據受限情況下模型學習能力較差的問題,提出一種基于時空圖結構學習與路線特征增強的行程時間預測方法。[方法]該方法首先利用自適應機制初始化基礎的時空圖結構,并構建基于Encoder-only的學習組件,靈活且深入地捕捉全域路網范圍內路段間的時空交互依賴關系,從而生成高質量的波及效應時空圖及相應的時空特征表...
基于Rank一致性與假設檢驗方法的專利語義相似度測度效果評價方法及其應用————作者:周健;呂璐成;李佳政;趙亞娟;
摘要:【目的】構建專利語義相似度測度效果量化評價方法,實現多種專利語義相似度測度方法的客觀評價�!痉椒ā炕谕环诸悓蛹壪聦@Z義相似度更高的思想,兼顧時間與技術領域因素自動構造測度效果評價數據集,設計Rank一致性指標指標和假設檢驗方法來構建針對不同向量化模型的專利語義相似度測度效果評價方法,并構建中文和英文專利數據集進行評價方法的實證�!窘Y果】本文選擇基于L1距離的Rank一致性指標與U檢驗進行了實...
基于RF-ISSA-SVM和SHAP的疾病誘因可解釋性模型—以肥胖癥為例————作者:馬捷;孫文晶;郝志遠;
摘要:[目的]本研究旨在構建具有可解釋性的高質量疾病預測模型,通過識別影響疾病形成的關鍵誘因,并進一步分析誘因對于疾病的作用方式,從而為輔助診斷和精準醫療賦能助力。 [方法]以肥胖癥為研究對象,首先,利用隨機森林模型在疾病數據的多維特征中篩選出最具代表性的特征子集;其次,通過構建增強型麻雀搜索算法實現支持向量機核參數與懲罰系數的自適應獲取;然后,同步應用優化后的支持向量機模型對數據樣本進行預測分析,并...
科學數據推薦研究綜述————作者:張博睿;楊寧;張鑫;文奕;
摘要:[目的]總結國內外科學數據推薦的研究現狀,為促進科學數據共享研究提供理論基礎。 [文獻范圍]在CNKI、WOS、Google Scholar中使用“科學數據推薦”、“科學數據集推薦”、“Scientific data recommendation”、“Scientific dataset recommendation”等關鍵詞進行檢索,并結合主題篩選和追溯法,篩選出71篇代表性文獻。 [方法]基于...
專利策略視角下基于深度學習的專利商業化潛力預測方法研究————作者:向姝璇;毛進;李綱;
摘要:[目的]就現有方法替代指標選取、特征體系構建、模型結構設計上對專利商業化潛力與專利策略關聯利用不足的問題提出一個新的專利商業化潛力預測方法。[方法]將專利實際維持時間是否超過設定閾值作為判斷商業化潛力的標準,提出由特征處理模塊與多任務并行預測模塊構成的LSTM+MTNN模型。特征處理模塊拼接數值特征與Bert+SimCSE及LSTM模型生成的文本連續特征形成多任務并行預測模塊的輸入。多任務并行(M...
多維細粒度政策知識圖譜構建方法————作者:趙雅潔;馮凌子;袁軍鵬;王立學;
摘要:[目的]政策蘊含豐富的信息資源,加強政策知識圖譜頂層設計,構建適配領域特性的通用政策知識圖譜,可將碎片化政策信息進行高效融合、共享和利用。[方法]運用解構主義觀點,融合對齊多理論與政策要素定位,實現多維度政策知識表示,形成模式層;結合網絡獲取、索引匹配、全文解析、實體識別與文本分類模型,設計細粒度知識要素抽取方法,獲取數據層;利用Neo4j圖數據庫實現知識存儲,可視化形成知識圖譜。[結果]最終構建...
關鍵核心技術識別的研究進展————作者:仵軒;李廣建;潘佳立;
摘要:【目的】對關鍵核心技術識別相關成果進行系統綜述,厘清其研究重點與發展脈絡,以期為后續研究提供參考�!疚墨I范圍】基于關鍵核心技術的系統分析制定檢索式,在Web of Science和CNKI數據庫中進行文獻檢索,獲取661篇論文進行定量分析,經人工篩選得到60篇代表性文獻進行綜述。【方法】首先,歸納關鍵核心技術的概念特點及檢索策略以明晰綜述范圍;其次,分析關鍵核心技術的特征體系及識別標準以厘清研究思...
用于隱私政策合規性分析的知識融入提示學習方法————作者:李非燕;曹詩權;蘇宇;
摘要:【目的】在數字化轉型和移動互聯網快速發展的背景下,隱私政策合規性分析已成為關鍵議題。以往的自動化分析方法主要關注隱私政策的完整性,忽略了分析隱私政策的一致性。同時,這些方法需要大量的標注樣本,限制了其使用場景。本文致力于提出一種兼顧完整性和一致性、且不需要標注樣本的自動化隱私政策合規性分析方法�!痉椒ā渴紫龋鶕秱人信息保護法》等相關法規標準,從完整性和一致性兩個角度構建了隱私政策合規性評價體系...
融合時態信息和圖結構動態演化的知識圖譜補全模型研究————作者:張強;高穎;任豆豆;馬志遠;周洪;陶皖;
摘要:[目的]知識圖譜內蘊含海量的元組數據,且蘊含時態信息的知識圖譜可將隨時間變化的事實進行有效保留及使用。探究時態知識圖譜補全任務對圖譜內動態數據的完備性及其下游應用的發展有著重要意義。[方法]針對當前多數方法將時態知識圖譜視為離散數據,無法準確反應事物與時間信息的關系,忽略了局部圖結構演化與形成過程,以及全局圖結構演化所代表的圖譜連續形成模式。本文設計了如下流程:針對局部結構捕獲,提出基于表示強化的...
基于集成學習與半監督學習的突發事件識別研究————作者:田甜俊子;朱學芳;
摘要:[目的]緩解應急管理中高領域適配性標注數據稀缺的現狀,提高事件識別效果。[方法]研究基于集成學習與半監督學習提出一個持續自動標注學習機制,并結合實體識別、共現網絡分析、情感分析等技術實現一個突發事件識別系統。[結果]持續自動標注學習機制能夠使用全量數據的20%~35%達到與全量數據相當甚至更好的識別效果。[局限]當前研究收集的數據來源于中國新聞網單一網站,且注重對已有情報的挖掘,在豐富數據來源、應...
基于多模態橋連接的社交媒體多標簽情感分析————作者:于玉海;邢志琦;孟佳娜;高臨霖;王博林;
摘要:[目的]在互聯網迅速普及的時代,人們可以在數字平臺上以多種形式表達自己的情感,多模態情感分析已成為研究熱點,其研究結果將為情感分析提供有力支持。[方法]首先提取單模態的特有特征和多模態的共有特征,然后使用跨模態橋連接實現多模態融合,最后引入多頭自注意力機制進行多標簽預測,有效捕捉不同情緒標簽之間的共現關系。[結果]在CMU-MOSEI數據集上的實驗結果表明,本文模型在不同參數和對比實驗中,相比于基...
面向問題域的方法知識創新路徑識別研究——以計算語言學領域為例————作者:毛進;梁瑜萱;
摘要:[目的]通過厘清領域的研究問題、識別領域研究方法的創新路徑,幫助掌握領域發展的重點方向和領域內方法創新的演化脈絡。[方法]本文首先提出方法創新知識表示模型,利用SciBERT-BiLSTM-CRF模型識別論文全文中的問題知識與方法知識;然后根據共現關系分別構建領域問題網絡和方法創新網絡;最后使用社區發現算法對領域問題網絡進行子類劃分,并采用網絡全局搜索提取面向問題域的方法知識創新主路徑。[結果]從...
大模型主旨增強的圖文多模態句子摘要生成方法————作者:張樂;許央科;陳巖松;張雷瀚;
摘要:[目的] 運用圖文信息進行摘要生成的過程中,針對圖文信息不完全和參考摘要相關,直接融合導致噪聲信息引入的問題,提出一種大模型主旨增強的圖文多模態句子摘要生成方法。 [方法] 對大語言模型進行微調以生成高質量的主旨和關鍵詞信息,運用注意力機制有效地融合主旨和圖片信息以減少多模態特征內存在的噪聲信息;將原文本和關鍵詞進行融合以獲得增強主旨信息的多模態語義補充特征,最后融合兩種特征生成多模態摘要。 ...
基于隱喻信息和指令調優的心理疾病檢測————作者:張冬瑜;莊沐霖;靳森源;劉馨月;
摘要:[目的] 針對目前大量心理疾病檢測研究未能充分考慮到隱喻性信息在疾病識別過程中的關鍵作用,提出一種基于隱喻信息和指令調優的心理疾病監測方法。[方法] 該方法的核心在于通過隱喻識別技術引入隱喻信息,這包括對隱喻的使用頻率和隱喻中的實體間關聯性進行分析。此外,利用大語言模型捕捉癥狀和情緒信息,并整合這些特征,構建了指令集,對模型進行有效訓練。[結果] 本文模型在Twitter-Depression和M...
基于視覺線索學習的多模態命名實體識別————作者:白宇;王連吉;劉翔;袁金福;張桂平;
摘要:[目的]為提高多模態命名實體識別的效果,本文通過計算實體錨文本與圖像區域的語義相關性來過濾不相關視覺區域,達到消除視覺噪聲的目的。[方法]使用提示詞代替類別詞作為實體錨文本對視覺區域進行語義相關性評估,通過降低無關視覺區域的權重來消除無關視覺區域對實體識別的影響,采用多層交互式Transformer進行文本-視覺的模態融合,并通過CRF層實現實體識別。[結果]在公開數據基準上的實驗結果表明,本文方...
相關科技期刊推薦
核心期刊推薦
copyright © www.anghan.cn, All Rights Reserved
搜論文知識網 冀ICP備15021333號-3