2023年澳门太阳集团9728网站
信息技術研究生論壇(十四)
場次一、
時間:2023年6月26日(星期一)9:00-12:00
地點:澳门太阳集团9728网站807b教室
報告題目一:一種高效并行的印章文字檢測識别
報告人:白澳坤
報告簡介:在中文印章場景文本識别中,由于存在印章文字彎曲排列、模糊、遮擋等現象,加之真實場景數據集缺乏,給印章文本識别帶來巨大的挑戰。目前辦公場景中對中文印章的文字識别主要依靠人力,效率非常低。為解決上述問題,針對文本區域檢測與文本識别兩階段,分别改進可微二值化檢測算法(DBnet)和卷積遞歸神經網絡識别算法(CRNN),構建基于 DB-ECA 的檢測模型和基于 CRNN-Infer 的識别模型。将高效通道注意力模塊加入可微二值化網絡,解決特征金字塔沖突,并改進卷積層網絡結構,推遲下采樣來減少語義特征丢失。識别模型使用以自注意力為基礎的推理層代替循環層,解決循環神經網絡隻能單向串行傳輸的限制,并行預測特征序列的标簽分布。用該模型在自制的數據集上進行實驗,在不需要複雜的預處理操作的情況下,對中文印章的文字識别精确率達到 91.29%,充分了說明該模型的有效性。
報告題目二:一種通過字形和拼音信息加強的中文預訓練模型
報告人:林雲傑
報告簡介:自Bert以來,大規模預訓練模型已成為自然語言處理研究的一大重點,無論是訓練更大的模型,還是改變預訓練方法,關于預訓練模型的前沿研究從未停滞。不同于英文字母,中文的字形和拼音都有其獨特的含義,例如“液”、“河”和“湖”都有相同的偏旁,其含義也有聯系;中文漢字“樂”是一個多音字,讀“yue”時代表音樂,讀“le”時便代表快樂的意思。ChineseBERT預訓練模型從漢字本身的這兩大特性出發,将漢字的字形與拼音信息融入到中文語料的預訓練過程。一個漢字的字形向量由多個不同的字體形成,而拼音向量則由對應的羅馬化的拼音字符序列得到。二者與字向量一起進行融合,得到最終的融合向量,作為預訓練模型的輸入。模型使用全詞掩碼和字掩碼兩種策略訓練,使模型更加綜合地建立漢字、字形、讀音與上下文之間的聯系。
報告題目三:灰盒模糊測試中的自适應多目标優化研究
報告人:楊婵娟
報告簡介:覆蓋引導灰盒模糊測試(CGF)是一種高效的軟件測試技術。CGF 中通常有多個目标需要優化。然而,現有的CGF方法無法同時成功地找到多個物鏡的最佳值。報告提出了一種用于多目标優化(MOO)的灰盒模糊器,稱為MobFuzz:将多目标優化過程建模為多玩家多臂老虎機(MPMAB)。首先,它自适應地選擇包含最适合當前情況的目标的目标組合。其次,MobFuzz的模型處理功率時間表,它在選定的目标組合下自适應地将能量分配給種子。在MobFuzz中,提出了一種稱為NIC的進化算法,以同時優化我們選擇的目标,而不會産生額外的性能開銷。為了證明MobFuzz的有效性,對12個真實世界的程序和MAGMA數據集進行了實驗。實驗結果表明,MobFuzz中的多目标優化優于基線模糊器中的單目标模糊測試。與它們相比,MobFuzz可以選擇最佳物鏡組合,并将多個物鏡的值提高到107%,能耗最多可降低55%。此外,MobFuzz的程序覆蓋率提高了6%,并且發現的獨特錯誤比基線模糊器多3倍。NIC算法至少提高了2倍,性能開銷約為3%。
報告題目四:基于信任和優先級的無人機輔助車聯網的路由和移動及面向服務的解決方案
報告人:孫晗
報告簡介:無人機輔助解決方案是一個要求很高且很受歡迎的研究領域,無人機可以從地面網絡發送或收集數據。近年來,由于快速增長和新的數據傳輸架構,車聯網網絡出現了擁塞問題。該領域的數據通信可以使用車輛節點實現。由于節點的獨特特性和高移動性,動态拓撲、不可預測的網絡模式和其他障礙降低了這些網絡的性能,并導緻斷開、延遲和數據包丢失問題。報告提出了一種基于信任和優先級的無人機輔助車聯網(TPDA-IoV)解決方案,用于車聯網中車輛節點和無人機之間的數據路由。該方案基于無人機對無人機(D2D)和無人機對車輛(D2V)數據通信和信任評估三個模塊。該解決方案特别适用于IoV網絡出現擁塞問題,地面基站由于擁擠的交通模式和人口密集的城市道路以及有限的基礎設施設置而無法處理從車輛節點接收到的所有通信的情況。消息需要緊急決策服務,以避免網絡中的任何嚴重問題。建議的解決方案提供無人機輔助資源,通過使用從基站接收到的交通密度信息來收集或發送數據。這種解決方案是擁塞網絡的最佳選擇,在這種網絡中,由于設備上的密度和負載,通道無法傳輸數據。提出的解決方案還通過選擇無人機之間最優的能量水平來解決無人機電池有限的問題。該解決方案在包傳遞比、網絡開銷和端到端延遲方面與最新的解決方案進行了測試。與現有的解決方案相比,提出的解決方案實現了較高的性能。
報告題目五:BMC3C:使用密碼子、序列特征和覆蓋度對宏基因組重疊群分箱
報告人:符龍
報告簡介:宏基因組學直接從環境樣品中獲取全部微生物的DNA,無需經曆人工純培養階段,在微生物的研究中發揮了不可替代的作用,給微生物領域的研究帶來了新的發現。随着下一代測序技術的快速發展,宏基因組數據量越來越大,宏基因組分類也越來越困難。宏基因組分類直接影響着宏基因學後續的研究,因而如何高效地從這些數據中對DNA序列進行分類,已經成為了宏基因組學相關研究中的關鍵問題。針對無監督的宏基因組分類問題,提出了一種基于集成k-means與圖分割的宏基因組分類方法--BMC3C,并探索引入了一種全新的特征--密碼子使用模式。BMC3C首先自動地探索聚類個數,并利用不同的初始化信息重複地執行多次k-means對序列進行多次聚類。然後根據這些聚類結果構建一個權重圖,其中每一個節點代表一個序列,而節點之間的權重代表聚類結果中兩個序列之間的關聯性。如果兩條序列頻繁地被聚類到一個類簇中,那麼它們之間的權重就大,反之則小。最後,BMC3C利用圖分割的方法将權重圖分割為多個子圖,每一個子圖代表一個類。在模拟數據集以及真實數據集上的實驗結果顯示,BMC3C的實驗效果顯著好于其他對比算法。BMC3C是第一次将密碼子使用模式與集成聚類引入無監督宏基因組分類,實驗驗證了集成算法在BMC3C中的有效性,同時實驗還探究并且驗證了新引入的密碼子特征在宏基因組分類中的有效性。
報告題目六:基于計算機視覺的車道線檢測技術研究
報告人:石家彬
報告簡介:随着智能交通的發展,近年來,智能輔助駕駛技術已成為研究熱點,而車道線檢測是智能輔助駕駛的一項基本任務。準确識别車道線的位置能為車輛安全行駛提供重要信息,因此,研究車道線檢測具有重要的現實價值。基于計算機視覺的車道線檢測首先從視覺傳感器中提取圖像并輸入車道線檢測系統;其次對圖像進行預處理,包括圖像去噪、數據增強、光照效果處理、感興趣區域選取等;然後對選擇的感興趣區域進行特征提取,特征提取涉及車道線的顔色、紋理、邊緣、方向、曲率、車道線與路面的對比度等特征;最後進行車道線檢測,從圖像中檢測線段,将檢測到的線段分為左側車道線、右側車道線,或非車道線,利用車道線檢測實現對實際車道位置的估計。
報告題目七:一種高效的gpu上的并行安全機器學習框架
報告人:龐飔
報告簡介:随着機器學習在我們的日常生活中被廣泛地應用,大量的數據不斷産生并傳輸到雲端進行模型訓練和數據處理,安全機器學習或機器學習中的安全性越來越重要,因為目前的大規模機器學習任務通常在HPC服務器上進行,可以由第三方提供。目前,多方計算已廣泛應用于機器學習,與差異隐私在原始數據中插入幹擾數據不同,多方計算将原始數據集分成幾個包含部分數據的加密副本,然後将這些加密副本分發到不同的服務器上。以前關于安全機器學習的工作主要集中在新的協議或提高準确性上,而性能指标卻被忽略了。在本文中,我們提出了一個基于gpu的框架ParSecureML來提高基于雙方計算的安全機器學習算法的性能。
場次二、
時間:2023年6月26日(星期一)16:10-18:00
地點:澳门太阳集团9728网站601教室
報告題目一:輕量級單目3D目标檢測算法研究
報告人:浦斌
報告簡介:單目3D目标檢測的主要問題是實例深度估計不準,而這個不準主要表現為遠處實例深度估計不準。近處目标的實例深度估計準确,而對于近處目标檢測車輛應當需要更快的檢測器以便檢測未知危險。而現今基于直接回歸的單目3D目标檢測器普遍在25FPS左右,能在長距離上滿足實時性的需求,而對于近處車輛感知的推理速度仍然不足,為此有必要研究輕量級的單目3D目标檢測算法以用于對近處目标的快速處理。
報告題目二:基于深度學習的單目深度估計研究
報告人:李林珂
報告簡介:單目深度估計是計算機視覺任務,它根據給定的輸入圖像預測相應的深度圖。基于有監督的單目深度估計方法基于深度圖的地面真值,在模型訓練時需要依賴真實深度依賴龐大的數據進行網絡模型的訓練,而網絡模型的訓練需要依賴真實深度值。真實深度值的獲取成本高昂,且範圍有限,需要精密的深度測量設備和移動平台采集的原始深度标簽通常是稀疏點,不能與原圖很好的匹配。基于無監督的單目深度估計是一種不需要地面真實值進行訓練的方法,近年來引起了人們的關注。設計輕量級但有效的模型,以便它們可以部署在邊緣設備上,這是單目深度估計的主要任務。
報告題目三:惡劣天氣下的目标檢測研究
報告人:梁馨予
報告簡介:盡管基于深度學習的目标檢測方法在傳統數據集上取得了可喜的結果,但從惡劣天氣條件下捕獲的低質量圖像中定位目标仍然具有挑戰性。現有方法要麼難以平衡圖像增強和目标檢測的任務,要麼經常忽略對檢測有益的潛在信息。為了緩解這個問題,有研究者提出了一種新穎的圖像自适應YOLO (IA-YOLO) 框架,其中每個圖像都可以自适應增強以獲得更好的檢測性能。
報告題目四:基于深度學習的圖像重建方法研究
報告人:吳宇琴
報告簡介:近年來,由于基于深度學習的方法比基于濾波、基于模型和傳統的基于學習的方法獲得了更有前景的去噪結果,它們已成為主流方法。其中卷積神經網絡(convolutional neural networks, CNNs)在從大規模數據中學習可推廣的圖像先驗方面表現良好,這些模型被廣泛應用于圖像重建和相關任務中。最近,另一類神經網絡架構transformer在自然語言和高級視覺任務上表現出了顯著的性能提升。
場次三、
時間:2023年6月27日(星期二)15:00-17:00
地點:澳门太阳集团9728网站601教室
報告題目一:基于射頻信号的人類活動識别
報告人:羅澍宇
報告簡介:相比于傳統的基于視覺或者基于可穿戴傳感器的方式,無線感知得益于其保護隐私、無接觸、能感知微小生理信号以及不受光照、遮擋等影響的優良特性而受到工業界和學術界的廣泛關注。如今,無線感知技術已成為許多人機交互場景的關鍵性技術,在醫療、養老、人機交互等領域得到了廣泛的應用。本次報告将介紹基于無線射頻信号的人體活動識别基本方法以及當前面臨的挑戰。
報告題目二:基于多模态醫學圖像的多任務智能診斷模型研究
報告人:邱俊铼
報告簡介:多模态醫學圖像融合是近年來人工智能研究的重點,多模态數據往往具有互補性,由于看待事物的角度不同,得到的信息也會有所不同,單一角度得到的信息通常具有一定的局限性,但是将多個角度得到的互補信息相融合,往往就能得到相對全面的信息。同時,對醫學圖像數據的分割、分類和預後,雖然是不同的任務,但卻具有相通之處,有可以共享的信息,多任務之間可以相互促進。本次報告将介紹基于多模态醫學圖像的多任務智能診斷模型,并與目前已有的一些圖像處理算法進行比較,對不同的數據融合方式和多任務學習思路進行探讨。
報告題目三:基于增強型多通道圖卷積的方面情感三元組抽取方法研究
報告人:謝澤
報告簡介:方面級情感分析(Aspect-based Sentiment Analysis, ABSA)是一項細粒度的情感分析任務,主要針對句子級别的文本,分析文本中相關的方面項(Aspect Term)、觀點項(Opinion Term)、方面類别(Aspect Category)和情感極性(Sentiment Polarity),在不同的場景下對應着不同的子任務。方面情感三元提取(Aspect Sentiment Triplet Extraction ,ASTE) 是Aspect-based Sentiment Analysis (ABSA) 的一個新變體,旨在從句子中提取方面情感三元組,構建情感知識圖譜,每個三元組包含三個元素,即方面詞、觀點詞及其情感極性。本報告将對解決該任務的四種主流範式進行探讨,并介紹一種基于增強型多通道圖卷積的方面情感三元組抽取方法。