書單推薦 新書推薦 |
場景文字視覺問答技術理論與實踐研究
場景文字視覺問答,是指給定場景圖像并回答場景圖像中場景文字相關問題的技術。這需要模型具備推理、分析和理解圖片中的文本信息的能力,這是多模態(tài)理解的重要基礎,是從感知智能走向認知智能的重要一步。本書主要介紹場景文字視覺問答的最新進展和技術方向,主要內容包括緒論、場景文字視覺問答相關概念、以場景文本語義為中心的場景文字視覺問答方法、基于文本語義上下文學習及空間表示的場景文字視覺問答方法以及基于圖像分割和匹配的場景文字視覺問答方法。
你還可能感興趣
我要評論
|