2023年澳门太阳集团9728网站
信息技術研究生論壇(十六)
場次一、
時間:2023年7月3日(星期一)9:00-12:00
地點:澳门太阳集团9728网站807b教室
報告題目一:一種用于檢測車聯網中新型位置僞造攻擊的不當行為檢測系統
報告人:孫晗
報告簡介:在車聯網(IoV)網絡中,車輛定期交換包含速度和位置信息的基本安全信息(BSMs)。安全關鍵應用,如盲點警告和變道警告系統,使用BSM來确保道路使用者的安全。為了在網絡中制造混亂,内部攻擊者可能會向BSM注入虛假信息,并将其廣播給附近的車輛。其中一種攻擊是位置僞造攻擊,攻擊者在BSM中插入關于位置的虛假信息。文獻已經探讨了使用不當行為檢測系統(MDS)來檢測此類攻擊。但現有方法的局限性在于,它們要麼在特定的環境設置中表現得非常好,要麼在有利于廣義模型的檢測精度上有所妥協。此外,目前所有基于機器學習的檢測模型都是基于簽名的,這需要事先了解攻擊才能有效檢測。報告提出了一種用于車聯網的新型位置僞造攻擊檢測系統(NPFADS for the IoV),以學習和檢測出現在車聯網網絡中的新型位置僞造攻擊。使用指标精密度、召回率、F1分數、ROC曲線和PR曲線分析NPFADS的性能。車輛參考不良行為(VeReMi)數據集作為研究的基準。該系統的性能與文獻中已有的MDS進行了比較。分析表明,即使初始化時對新位置僞造攻擊的知識為零,該系統的性能也優于現有的監督學習模型。
報告題目二:自适應尺度融合
報告人:白澳坤
報告簡介:近年來,基于分割的場景文本檢測方法在場景文本檢測領域引起了廣泛的關注,因為它們受益于像素級描述,在檢測任意形狀和極端長寬比的文本實例方面具有優越性。然而,絕大多數現有的基于分割的方法僅限于其複雜的後處理算法和分割模型的規模魯棒性,其中後處理算法不僅與模型優化隔離,而且耗時且耗時。通常通過直接融合多尺度特征圖來增強尺度魯棒性。因此提出了一種可微分二值化(DB)模塊,它将二值化過程(後處理過程中最重要的步驟之一)集成到分割網絡中。與所提出的數據庫模塊一起優化,分割網絡可以産生更準确的結果,從而通過簡單的管道提高文本檢測的準确性。此外,提出了一種高效的自适應尺度融合(ASF)模塊,通過自适應地融合不同尺度的特征來提高尺度魯棒性。通過将所提出的 DB 和 ASF 與分割網絡相結合,提出的場景文本檢測器在五個标準基準測試中在檢測精度和速度方面始終達到最先進的結果。
報告題目三:基于BERT的COVID-19流行病學調查信息的中文命名實體識别
報告人:林雲傑
報告簡介:命名實體識别就是從非結構化的輸入文本中抽取出一系列實體,即具有特定意義的實體,包括人名、地名、機構名、專有名詞等,并且可以按照業務需求識别出更多類别的實體。基于COVID-19流行病學調查信息的命名實體識别有助于分析疫情的來源和傳播途徑,更好地控制疫情的傳播。本次報告主要介紹中文命名實體識别模型BERT-BiLSTMIDCNN-ELU-CRF(BBIEC),該模型首先将未标注的COVID-19流行病學調查信息處理成字符級語料,并根據BIOES字符級标注系統進行人工實體标注,然後使用BERT預訓練模型得到詞向量位置信息;然後,通過雙向長短期記憶神經網絡(BiLSTM)和改進的疊代擴張卷積神經網絡(IDCNN)從生成的詞向量中提取全局上下文和局部特征并将它們串聯起來;将所有可能的标簽序列輸出到條件随機場(CRF);最後通過條件随機場解碼生成實體标簽序列。該模型在識别COVID-19流行病學調查信息的實體方面優于其他傳統模型,能有效的識别出流行病學調查信息中的一系列命名實體。
報告題目四:基于覆蓋率的模糊測試的曆史驅動突變
報告人:楊婵娟
報告簡介:基于突變的模糊測試是發現程序中漏洞的最流行方法之一。為了緩解突變過程中高随機性導緻的基于突變的模糊測試效率低下的問題,近年來開發了多種解決方案,特别是基于覆蓋的模糊測試。它們主要采用自适應突變策略或集成約束求解技術來很好地探索觸發獨特路徑和崩潰的測試用例。然而,他們缺乏對模糊測試曆史的細粒度重用來構建這些有趣的測試用例,即他們在很大程度上未能在不同的模糊測試中正确利用模糊測試曆史。事實上,模糊測試曆史中的測試用例包含有關關鍵突變策略的豐富知識,這些策略導緻發現獨特的路徑和崩潰。具體來說,這些突變策略中隐含的部分路徑約束解決方案可以重用于加速發現共享類似部分路徑約束的新路徑和崩潰。
因此,報告首先提出了一種輕量級高效的概率字節定向模型(PBOM),該模型從試驗内和試驗間的曆史中正确捕獲字節級突變策略,從而可以有效地觸發獨特的路徑和崩潰。然後,提出了一個名為EMS的新型曆史驅動突變框架,該框架使用PBOM作為突變算子之一,根據輸入的突變字節值概率地提供所需的突變字節值。報告在9個現實世界的程序中根據最先進的模糊器(包括AFL、QSYM、MOPT、MOPT-dict、EcoFuzz和AFL++)評估EMS。結果表明,EMS發現的獨特漏洞比基線多4.91倍,并且在大多數程序中發現的線路覆蓋率高于其他模糊器。
報告題目五:一種基于深度學習的漏洞檢測方法
報告人:龐飔
報告簡介:傳統的漏洞研究方法往往要求安全研究人員具備專業知識和豐富的實踐經驗、通用性較差、效率有限、成本高、高誤報率以及高漏報率等問題,已無法滿足複雜軟件的安全性分析需求。随着人工智能産業的興起,大量機器學習,數據挖掘的方法被嘗試用于解決軟件漏洞挖掘問題。基于機器學習的軟件漏洞挖掘模型主要對數據表征模塊中的代碼表征形式與編碼模型、模型訓練模塊中的機器學習模型進行改進,使得其成本、效率和準确率更高。報告提出一種新的混合cnn-lstm方法,該方法由CNN和RNN的複合神經網絡組成,可增強漏洞檢測。使用卷積神經網絡從代碼度量中提取特征,然後使用長期短期記憶網絡 (cnn ‐ lstm) 來檢測代碼度量中的漏洞。
報告題目六:基于深度密度聚類的宏基因組DNA重疊群分類算法
報告人:石家彬
報告簡介:宏基因組是從生物環境的樣本中直接獲得的DNA序列數據。宏基因組測序技術隻能獲得短序列,大多數方法首先将短序列組裝成更長的重疊群,然後對得到的重疊群進行聚類。基于宏基因組測序序列,将組成相似或豐度一緻的重疊群聚類到同一物種稱為重疊群分箱。現有的重疊群宏基因組學分箱方法主要可分為三類:基于組成、基于豐度和基于組成和豐度。基于深度密度聚類的宏基因組 DNA 重疊群分類算法對于目前 DNA 重疊群分類問題所存在的一些重點和難點方面進行了如下研究:(1)宏基因組 DNA 重疊群 k-mer 頻率特征提取;(2)構建一種基于重疊群長度特征加權的 VAE特征學習模型;(3)提出一種基于深度密度聚類的宏基因組重疊群分類策略。
報告題目七:VAMB:使用深度變分自動編碼器改進宏基因組分箱和組裝
報告人:符龍
報告簡介:盡管宏基因組分類最近取得了進展,但從宏基因組數據重建微生物物種仍然具有挑戰性。在這裡,開發了用于宏基因組分箱的變分自動編碼器(VAMB),該程序使用深度變分自動編碼器在聚類之前對序列共豐度和k-mer分布信息進行編碼。變分自動編碼器能夠集成這兩種不同的數據類型,而無需事先了解數據集。VAMB的性能優于現有的最先進的binner,在模拟和真實數據上分别重建了29-98%和45%的接近完整(NC)基因組。此外,VAMB能夠分離出平均核苷酸同一性(ANI)高達99.5%的密切相關菌株,并從1,000個人類腸道微生物組樣本的數據集中将255個和91個NC普通拟杆菌和多雷拟杆菌樣本特異性基因組重建為兩個不同的簇。使用該數據集中的2,606個NCbin來顯示人類腸道微生物組的物種具有不同的地理分布模式。
場次二、
時間:2023年7月03日(星期一)15:00-18:00
地點:澳门太阳集团9728网站807b教室
報告題目一:基于用戶交互的半自動圖像分割
報告人:黃秋凱
報告簡介:圖像分割是許多視覺理解系統的重要組成部分。它涉及到将圖像(或視頻幀)劃分為多個段或對象。分割在廣泛的應用中起着核心作用,包括醫學圖像分析(如腫瘤邊界提取和組織體積測量)、自動駕駛汽車(如導航表面和行人檢測)、視頻監控和增強現實。交互式圖像分割又稱為輔助分割或半自動圖像分割,指利用用戶的交互提供先驗信息,從背景中提取圖像區域或感興趣的對象的任務。交互通常分為基于scribble的交互、基于bounding box的交互和基于click的交互,允許用戶提供良好的約束(大小、顔色、位置、目标等)來指導分割過程。與自動分割方法相比,這可以提高結果,并減少運行時間。事實上,許多計算機視覺應用程序(醫學成像、圖像編輯、目标識别和目标跟蹤)需要這樣的用戶幹預來獲得準确的分割結果,然後将其用作其他高級處理的輸入。
報告題目二:基于自适應卡爾曼濾波的多目标跟蹤方法
報告人:鄭力文
報告簡介:報告主要介紹在多目标跟蹤(Multiple Object Tracking, MOT)領域,傳統MOT方法存在對不規則運動的目标進行跟蹤時效果較差的問題,所提出基于自适應卡爾曼濾波的多目标跟蹤方法能夠較好地解決。并探讨其與傳統MOT方法的不同之處。然後采用所提方法及傳統MOT方法在公共數據集MOT17、MOT20、DanceTrack上進行實驗驗證,并使用一些标準的性能指标進行評估。最後,探讨對多目标跟蹤方法進行輕量化處理,以利于工業化部署。
報告題目三:基于擴散模型的語義分割研究
報告人:郭行文
報告簡介:擴散模型作為最新的生成式模型,能夠生成具有高多樣性和高合成質量的圖像。除了圖像生成,擴散模型已經成功應用在其他視覺任務中,包括圖像修複、語義分割、異常檢測等。語義分割的目的是将圖像中的像素劃分為不同的語義類别,一般的擴散模型分割針對圖像掩碼,在前向加噪過程中對掩碼加入噪聲形成噪聲圖像,在去噪過程中去除噪聲,通過疊代最終完成對圖像的分割。原始圖片通常作為條件變量在去噪過程中輔助模型生成分割圖像。基于擴散模型的語義分割存在的挑戰是由于需要許多疊代去噪步數來從高斯噪聲中生成分割,導緻分割效率很低。
通過尋找更好的疊代方案,提高模型的分割效果。
報告題目四:一種簡單、高效的輕量級神經網絡
報告人:蔣浩東
報告簡介:為了設計輕量級卷積神經網絡,先前的工作(例如,MobileNetv1,MobileNetv2,ShuffleNetv1)都集中在降低FLOPs,然而FLOPs隻能間接衡量網絡的推理速度(延遲),FLOPs的減少不一定就使得網絡的推理速度提高,這主要是因為網絡的推理速度不僅和FLOPs有關,還和FLOPs有關。為了避免深度可分離卷積頻繁訪問内存造成低FLOPs的缺點,有研究者提出了部分卷積并在此基礎上構建了FasterNet。實驗表明,它在各種設備上實現了比其他輕量級神經網絡更高的運行速度且并未影響在多種視覺任務中的準确性。
報告題目五:基于元學習的小樣本語義分割研究
報告人:劉冠霆
報告簡介:傳統的有監督語義分割方法可以在經過大規模有監督數據集訓練後達到較好的分割效果。然而,有監督語義分割算法存在兩個難點:1. 依賴大量高質量有标記數據2.泛化性能不足。為了應對這兩個問題,小樣本語義分割方法被提出。小樣本語義分割方法借鑒元學習(meta-learning)思想,即讓機器能夠像人一樣“學會如何學習(learn to learn)”的思想,通過精心設計訓練任務、模型結構和損失函數,達到僅使用少量有标注的訓練樣本就可以對新的未标注的圖像語義類别預測的目的。小樣本語義分割可以在減輕圖像數據标注工作量的同時提高模型的泛化能力,從而擺脫深度學習對大規模、有标注數據集的依賴。本報告主要介紹小樣本語義分割的主流模型。
報告題目六:基于深度學習的半監督目标檢測算法研究
報告人:農甘骁
報告簡介:為了尋找數據效率更高的深度學習方法來克服全監督目标檢測對大型注釋數據集的需求,半監督目标檢測被提出。它通過探索大量易于獲得的未标記圖像,在有限的監督下學習圖像的特征表示,以減少所需的标記數據量。通過開發新方法或采用現有的半監督學習框架進行半監督目标檢測,目前主流的半監督目标檢測策略主要是基于僞标簽的方法和基于一緻性正則的方法。相比于完全依賴有标注數據的目标檢測,半監督目标檢測能夠更充分地利用未标注數據,通過引入更多的信息從而提高模型的泛化能力和性能。
報告題目七:基于TFA的小樣本目标檢測
報告人:廖海坤
報告簡介:在過去的幾年裡,我們可以看到大多數機器學習(ML)領域的範式轉變。傳統的預測方法是依靠手工提取特定于用戶和網絡的特征。而如今這種手工的方式大多數已經被端到端框架所取代,在端到端框架中,從輸入到輸出的映射與輸入的最方便表示一起學習。這些模型通常具有分層架構,其中較深的層在從先前層獲得的較簡單表示中表達的較複雜表示上操作。然而,這些模型的深度是有代價的:它們的表達性需要廣泛的假設空間,這反過來就要大量的數據來學習可靠的假設。事實上,在有限的數據集上訓練這些模型可能會導緻問題的過拟合表示,這也包括非信息特征。這些特征出現在數據集中,但不代表樣本的總體分布。為了彌合當前機器學習模型和人類智能之間的差距,小樣本學習(FSL)旨在設計能夠在有限數據範圍内成功運行的模型。與人類類似,小樣本模型必須利用某種先驗知識才能學習可靠的假設。雖然任何深度檢測器都可以集成到框架中,但在這項工作中使用了Faster R-CNN。在後者中,主幹網絡和RPN特征可以被認為是類不可知的,因此從base類學習的特征很可能被轉移到novel類而無需微調。相反,由框預測器學習的表示是類特定的。它們不會從base類轉移到novel類,需要在novel類上進行微調。而微調(TFA)框架顯示了一個二階段的方法。在前者中,模型僅在具有Faster R-CNN損失函數的base類上進行訓練。在第二階段中,框預測器在包含base類和novel類的平衡訓練集上進行微調。這些預測器是随機初始化的。使用相同的損失函數,但具有較小的學習率。這種選擇應該減少分類器遇到的類内方差,從而減輕從base類到novel類的檢測準确性的損失。
場次三、
時間:2023年7月3日(星期一)16:30-18:30
地點:澳门太阳集团9728网站509教室
報告題目一:基于逆向設計的多模彎曲波導
報告人:陳悅
報告簡介:光波導是連接光子集成電路(pic)中各種器件的基本元件,用于光計算、通信、傳感等領域。小尺寸、高性能的多模波導彎曲(MWB)對于片上光器件集成具有重要意義。多模波導承載來自不同用戶的信息,具有多個引導模式,以增加光互連的帶寬。然而,随着這些多模波導的應用提高了帶寬,集成系統的尺寸也可以急劇擴大,因為多模波導彎曲比單模波導彎曲半徑大得多。多模波導彎管(MWBs)的設計方法應重新考慮,以縮小其有效尺寸,以實現系統小型化。所選擇的研究方法是,90°彎曲的軌迹被分成兩個對稱的半部分,這兩個半部分相對于45°的對稱軸是彼此的鏡像,每個半部分被分割成小的彎曲部分。每個截面的彎曲半徑和波導寬度是使用優化算法确定的參數。
報告題目二:基于深度學習的ARPES光譜降噪
報告人:謝松霖
報告簡介:機器學習技術在去除圖像中噪聲方面的性能遠遠超過了傳統的圖像處理方法。然而,基于機器學習的圖像處理的應用大多局限于非科學目的。鑒于光譜實驗中神經網絡的去噪性能優異,而數據采集時間有限,引入基于機器學習的去噪技術,将對光譜實驗數據的采集和分析産生重大影響。最近的研究表明,機器學習在光譜數據特征提取、自能分析、x射線結構精細、超聲波光譜學等方面的成功應用。這些例子表明,機器學習在凝聚态物理中也是一個有用的工具。因此使用深度學習消除ARPES光譜的噪聲,這對于節省測量時間和提高光譜質量非常有幫助。
報告題目三:基于聯邦強化學習的計算任務卸載
報告人:張貴和
報告簡介: 在空天地一體化網絡中,針對本地IoT設備計算資源不足和電池限制的問題,利用無人機将IoT設備上的計算密集型應用卸載到基站上的邊緣服務器或者雲端的數據中心完成再返回計算結果,使得IoT設備完成任務的能源和時間延遲之和最小。但是随着而來的是計算任務卸載策略的問題,可以将計算任務卸載表示為馬爾可夫問題,再利用深度強化學習來解決。但是在為每個設備單獨訓練強化學習模型,會導緻訓練時間長和大量的資源浪費。因此可以将聯邦學習與深度強化學習相結合,個體在本地訓練共享的深度強化學習模型,聯邦學習的系統操作員在聚合所有更新的局部參數之後更新全局模型進而加快模型收斂速度。
報告題目四:超透鏡設計
報告人:何绮甯
報告簡介:自由調控電磁波(光)一直是人類的夢想和追求,這不僅具有重要的科學意義,而且在信息、國防、能源等領域有着廣泛的應用價值。超構材料的電磁響應可以按照工程的需要進行設計,由此實現了自然材料所不能實現的一系列電磁波調控現象,為自由調控電磁波提供了有效的手段。随着超構材料的發展,二維超構表面開始成為研究的主流方向。這得益于超構表面可在亞波長尺度内實現對相位、振幅和偏振等的靈活設計,并且兼具平面化和低損耗的優點。在衆多超構表面的應用中,光學超構透鏡是其中非常重要的一類。它的出現為減輕傳統光學系統負荷、實現光學系統集成化以及實現新功能提供了有效的技術途徑。超構透鏡可以同時獨立地調控光的相位、振幅、偏振等,不僅可以對單波長電磁波進行調控,還可以對一定光譜範圍電磁波的波長色散進行調控。因此,超構透鏡比同樣是平面結構的傳統衍射透鏡擁有更大的潛力。