工程師
其他
企業(yè)級
大模型
推薦課程
average > 0 ? $model->average . '分' : '10.0分' ?>

Agent智能體與多模態(tài)企業(yè)級應(yīng)用開發(fā)

鄒老師

長春工業(yè)大學(xué) 人工智能學(xué)院院長

鄒偉,長春工業(yè)大學(xué)人工智能學(xué)院院長、華東建筑設(shè)計研究總院研究員、山東交通學(xué)院客座教授、南昌航空大學(xué)碩士生導(dǎo)師、中國軟件行業(yè)協(xié)會專家委員、天津大學(xué)創(chuàng)業(yè)導(dǎo)師、中華中醫(yī)藥學(xué)會會員、中國醫(yī)藥教育協(xié)會老年運動與健康分會學(xué)術(shù)委員;領(lǐng)導(dǎo)團隊與全國兄弟高校、企業(yè)建立了廣泛的項目合作,完成50多個深度學(xué)習(xí)實踐項目,應(yīng)用于醫(yī)療、交通、農(nóng)業(yè)、氣象、銀行、電信等多個領(lǐng)域。

鄒偉,長春工業(yè)大學(xué)人工智能學(xué)院院長、華東建筑設(shè)計研究總院研究員、山東交通學(xué)院客座教授、南昌航空大學(xué)碩士生導(dǎo)師、中國軟件行業(yè)協(xié)會專家委員、天津大學(xué)創(chuàng)業(yè)導(dǎo)師、中華中醫(yī)藥學(xué)會會員、中國醫(yī)藥教育協(xié)會老年運動與健康分會學(xué)術(shù)委員;領(lǐng)導(dǎo)團隊與全國兄弟高校、企業(yè)建立了廣泛的項目合作,完成50多個深度學(xué)習(xí)實踐項目,應(yīng)用于醫(yī)療、交通、農(nóng)業(yè)、氣象、銀行、電信等多個領(lǐng)域。

課程費用

5800.00 /人

課程時長

2

成為教練

課程簡介

深入剖析Agent智能體與多模態(tài)企業(yè)級應(yīng)用開發(fā)。課程涵蓋大模型核心技術(shù)與架構(gòu),如Transformer-XL、MoE等,講解智能體Agent技術(shù)框架,包括規(guī)劃型、記憶型、工具調(diào)用型智能體及開發(fā)框架。

目標收益

培訓(xùn)對象

課程內(nèi)容

第一節(jié)大模型核心技術(shù)和架構(gòu)?分析
1.核心架構(gòu)拆解
2.Transformer-XL
3.Mixture-of-Experts(MoE)
4.Sparse Attention
5.闡述DeepSeek采取的訓(xùn)練方法
6.大模型預(yù)訓(xùn)練技術(shù)
7.RoPE位置編碼、FlashAttention優(yōu)化
8.大模型對齊技術(shù)
9.DPO(Direct Preference Optimization)
10.RLHF(基于人類反饋的強化學(xué)習(xí))
11.典型模型分析?:GPT-4 Turbo、Claude 3 Opus、DeepSeek-R1
第二節(jié)智能體Agent技術(shù)框架?
1.智能體范式?的組成,不同智能體的整體介紹
2.規(guī)劃型智能體?
3.Tree-of-Thought(ToT)
4.Graph-of-Thought(GoT)
5.記憶型智能體?
6.Vector Database(Pinecone/Chroma) + RAG(檢索增強生成)
7.工具調(diào)用智能體
8.Function Calling(OpenAI)
9.Toolformer(Meta)
10.Agent典型框架?
11.Agent的開發(fā)框架?
12.AutoGPT、MetaGPT、Microsoft AutoGen
13.目前大模型Agent的主流企業(yè)級框架
14.LangChain Agents
15.LlamaIndex
第三節(jié)多模態(tài)技術(shù)體系?的建立

1.輸入模態(tài)的融合?
2.視覺Vision-語言Language對齊方案
3.CLIP(Contrastive Language-Image Pretraining)模型的使用
4.多模態(tài)編碼器
5.Flamingo大模型在Few-shot、上下文處理的優(yōu)勢
6.基于Flamingo的結(jié)構(gòu)的Idefics2:SigLIP-SO400M+ Mistral-7B
7.輸出控制技術(shù)?
8.跨模態(tài)的生成
9.Stable Diffusion 3
10.跨語言語音生成領(lǐng)域標桿模型VALL-E X
11.企業(yè)級多模態(tài)數(shù)據(jù)處理流水線設(shè)計
第四節(jié)智能體核心能力開發(fā)?
1.規(guī)劃與推理能力?
2.基于ToT的復(fù)雜任務(wù)拆解(
3.案例:供應(yīng)鏈路徑優(yōu)化
4.知識圖譜驅(qū)動推理
5.工具:Neo4j + SPARQL查詢的使用
6.記憶與上下文管理?
7.長期記憶存儲
8.PostgreSQL + pgvector擴展
9.短時記憶優(yōu)化
10.KV Cache壓縮技術(shù)
11.工具調(diào)用開發(fā)?
12.企業(yè)API集成
13.RESTful接口封裝FastAPI
14.代碼庫:LangChain(鏈式編排)、LlamaIndex(企業(yè)數(shù)據(jù)索引)
15.調(diào)試工具:LangSmith(智能體行為追蹤)
第五節(jié)典型行業(yè)Agent智能體案例實操?
1、個性化推薦Agent?
技術(shù)組合?:DeepSeek-R1用戶畫像生成 + Faiss向量檢索 + 強化學(xué)習(xí)動態(tài)調(diào)優(yōu)
應(yīng)用場景?:實時分析用戶瀏覽/購買行為,生成跨品類推薦策略(“母嬰用品+家庭保險”組合營銷)?
數(shù)據(jù)源?:POS交易數(shù)據(jù) + 門店攝像頭行為分析(YOLOv11)?
2、合同審查Agent?
技術(shù)組合?:DeepSeek法律大模型 + DocParser OCR + 條款風(fēng)險知識庫
應(yīng)用場景?:百頁級并購協(xié)議關(guān)鍵條款提取與合規(guī)性審查,耗時從40小時壓縮至15分鐘?
3、電網(wǎng)調(diào)度Agent?
技術(shù)組合?:Fuxi氣象預(yù)測模型 + 圖神經(jīng)網(wǎng)絡(luò)(GNN)拓撲分析 + SCADA系統(tǒng)接口
應(yīng)用場景?:極端天氣下電網(wǎng)脆弱節(jié)點預(yù)警,自動生成負荷轉(zhuǎn)移方案?
4、設(shè)備運維Agent:
技術(shù)選型:LSTM故障預(yù)測模型 + 工控系統(tǒng)集成
應(yīng)用場景:運行商基站狀態(tài)維護、去年華為力推給運營商的節(jié)能模型
第六節(jié)多模態(tài)輸入輸出應(yīng)用落地技術(shù)?
1.視覺模態(tài)處理?:
2.目標檢測:YOLOv11 + SAM(Segment Anything)
3.圖像理解:DINOv2(自監(jiān)督視覺編碼器)
4.語音模態(tài)處理?:
5.語音識別:Whisper Large V3(低資源語言支持)
6.語音合成:XTTS v2(情感語音生成)
7.跨模態(tài)對齊技術(shù)?:
8.圖文生成一致性控制:Kosmos-2(微軟)
9.語音-文本同步生成:Voicebox(Meta)
10.企業(yè)級優(yōu)化方案?:
11.多模態(tài)緩存策略:Faiss向量索引加速
12.硬件加速:NVIDIA Triton推理服務(wù)器 + TensorRT優(yōu)化
多模型企業(yè)級應(yīng)用案例介紹
第七節(jié)多模型企業(yè)級應(yīng)用案例介紹?
1、智能客服系統(tǒng)?:
多模態(tài)輸入:用戶截圖+語音描述→問題定位(CLIP+Whisper)
多模態(tài)輸出:工單生成(文本) + AR操作指引(3D模型)
2、工業(yè)質(zhì)檢系統(tǒng)?:
視覺檢測:缺陷分類(ViT-Huge)
報告生成:缺陷位置標注(SAM) + 維修建議生成(GPT-4)
3、AR輔助工業(yè)維修系統(tǒng)?
設(shè)備故障現(xiàn)場視頻(手機拍攝)+ 工程師語音描述 → ?故障類型識別?
使用 ?ViT-Huge? 分類機械部件異常,結(jié)合 ?CLIP? 關(guān)聯(lián)語音關(guān)鍵詞與圖像特征?
維修步驟圖文生成、 通過?Blender腳本自動化生成設(shè)備拆解流程
4、智慧交通事故處理系統(tǒng)?
車載攝像頭事故片段(視頻)+ 車主語音描述 → ?責(zé)任判定預(yù)分析?
使用 ?YOLOv11? 檢測車輛碰撞軌跡, ?Whisper? 提取事故時間、地點等要素?
保險報案工單的生成、?ARKit?現(xiàn)場重建

課程費用

5800.00 /人

課程時長

2

預(yù)約體驗票 我要分享

近期公開課推薦

近期公開課推薦

活動詳情

提交需求