RM新时代网站-首页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

微軟新AI項目為文檔和電子郵件的圖像添加字幕

姚小熊27 ? 來源:人工智能實驗室 ? 作者:人工智能實驗室 ? 2020-11-18 10:54 ? 次閱讀

微軟的一項新AI項目旨在自動為文檔和電子郵件中的圖像添加字幕,以便視覺障礙軟件讀取圖像。

微軟的研究人員在有關(guān)預(yù)印本存儲庫arXiv的論文中解釋了他們的機器學(xué)習(xí)模型的原理。

該模型使用可視語音詞匯預(yù)訓(xùn)練(VIVO),它利用大量成對的圖像標(biāo)簽數(shù)據(jù)來學(xué)習(xí)視覺詞匯。然后,使用帶有適當(dāng)字幕的圖像的第二個數(shù)據(jù)以幫助教AI如何最好地描述圖片。

“理想情況下,每個人都應(yīng)在文檔,網(wǎng)絡(luò),社交媒體中為所有圖像添加替代文本,因為這可以使盲人訪問內(nèi)容并參與對話。但是,可惜,人們卻沒有?!蔽④汚I平臺小組的軟件工程經(jīng)理Saqib Shaikh說。

總體而言,研究人員希望AI能夠提供Microsoft現(xiàn)有字幕系統(tǒng)兩倍的性能。

為了對新AI的性能進行基準(zhǔn)測試,研究人員將其納入了“無上限”挑戰(zhàn)。在撰寫本文時,Microsoft的AI現(xiàn)在在其排行榜上排名第一。

“無上限的挑戰(zhàn)實際上是如何描述您在訓(xùn)練數(shù)據(jù)中沒有看到的那些新穎的物體?”微軟研究實驗室的首席研究經(jīng)理王麗娟評論道。

希望使用Microsoft自動字幕AI來構(gòu)建應(yīng)用程序的開發(fā)人員已經(jīng)可以這樣做,因為Azure Cognitive Services的Computer Vision軟件包中提供了該功能。

微軟令人印象深刻的SeeingAI應(yīng)用程序?qū)⑹褂眯碌腁I進行更新,該應(yīng)用程序使用計算機視覺描述視力障礙者的周圍環(huán)境。

“圖像字幕是可以實現(xiàn)廣泛服務(wù)的核心計算機視覺功能之一,”Azure AI認(rèn)知服務(wù)的CTO黃表示。

黃繼續(xù)說:“我們AI的這一突破以Azure為平臺,以服務(wù)于更多客戶?!?“這不僅是研究上的突破;在Azure上將突破轉(zhuǎn)化為生產(chǎn)所需的時間也是突破?!?/p>

改進的自動字幕功能也有望在今年晚些時候在Outlook,Word和PowerPoint中使用。
責(zé)任編輯:YYX

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 微軟
    +關(guān)注

    關(guān)注

    4

    文章

    6590

    瀏覽量

    104024
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    30728

    瀏覽量

    268886
收藏 人收藏

    評論

    相關(guān)推薦

    萬里紅電子郵件內(nèi)容保密檢查系統(tǒng)的優(yōu)勢

    電子郵件,作為一種更正式、專業(yè)的溝通渠道,是黨政機關(guān)單位處理業(yè)務(wù)工作中必不可少的通信方式之一。電子郵件傳輸迅速、使用便捷、長期保存,很多機關(guān)單位建設(shè)了專有的電子郵件系統(tǒng),進行公文傳遞、修改和審批
    的頭像 發(fā)表于 12-13 10:11 ?119次閱讀

    微軟新型專利實現(xiàn)電子郵件與聊天工具的無縫切換

     5 月 30 日消息,美國商標(biāo)和專利局近日于 5 月 21 日公布授予微軟一項專利,該專利涉及一種全新的系統(tǒng)可實現(xiàn)從電子郵件至聊天工具的無縫切換。
    的頭像 發(fā)表于 05-30 15:31 ?433次閱讀

    微軟AI新成果:將不可編輯PDF轉(zhuǎn)化為可編輯文檔

    市面現(xiàn)有相關(guān)軟件雖能將PDF轉(zhuǎn)為可編輯版,但易喪失原始布局。微軟研究論文名為《從不可編輯文檔生成可編輯文檔的方法和系統(tǒng)》,其獨特之處在于運用AI技術(shù)保持了字體、色彩、布局及
    的頭像 發(fā)表于 05-30 10:11 ?675次閱讀

    微軟Office Outlook Lite服務(wù)升級,支持短信功能

    據(jù)報道,微軟于今日宣布更新 Outlook Lite 服務(wù),使其支持 SMS 短信功能。微軟稱,通過此項升級,用戶現(xiàn)可整合管理電子郵件及 SMS 短信,有效提升溝通效率。
    的頭像 發(fā)表于 05-28 11:41 ?580次閱讀

    微軟網(wǎng)頁版PPT新增語音識別及字幕生成功能

    據(jù)報道,微軟計劃于今年六月份推出網(wǎng)頁版PowerPoint全新語音識別功能。此項功能將能夠監(jiān)控PowerPoint視頻中的聲音,進而自動生成字幕。
    的頭像 發(fā)表于 05-16 14:36 ?414次閱讀

    微軟中國AI團隊或?qū)⒄w搬遷至美國或澳大利亞

    5月15日,鈦媒體爆料稱,微軟公司已經(jīng)通過電子郵件形式,通知旗下中國區(qū)域負責(zé)人旗下AI研發(fā)團隊,包括C+AI團隊以及Azure ML團隊等,將全員遷移至美國或者澳大利亞。據(jù)悉,此次搬遷
    的頭像 發(fā)表于 05-15 16:29 ?910次閱讀

    谷歌Gmail將支持Gemini總結(jié)電子郵件內(nèi)容

    谷歌透露,Gemini 將協(xié)助 Workspace 和 Google One AI Premium 的用戶理解和處理電子郵件內(nèi)容。用戶可通過移動應(yīng)用和網(wǎng)頁版 Gmail 使用 Gemini
    的頭像 發(fā)表于 05-15 11:11 ?771次閱讀

    微軟新版Outlook郵件應(yīng)用提高垃圾郵件防御能力

    微軟稱,垃圾郵件即指收件箱中無意接收的、未經(jīng)許可的郵件信息,包括那些意圖推廣產(chǎn)品或服務(wù)的商家以及名為網(wǎng)絡(luò)釣魚的虛假郵件,這些郵件往往假扮成官
    的頭像 發(fā)表于 05-14 09:50 ?369次閱讀

    2024年第一季度電子郵件威脅報告:美國垃圾郵件數(shù)量居首,制造業(yè)受害較多

    具體而言,在各類被攻擊對象之中,制造業(yè)、政府部門以及IT行業(yè)成為了黑客的主要目標(biāo)。該報告顯示,在2024年第一季度,制造業(yè)收到了43%的電子郵件,政府部門15%,IT行業(yè)11%的攻擊。
    的頭像 發(fā)表于 05-14 09:31 ?703次閱讀

    微軟Windows 11 AI探索者功能揭秘

    早前于 4 月 27 日,Xeno 曾詳細解釋過 Windows 11 AI Explorer 的主要功能,其中一大亮點在于能夠追蹤用戶在電腦上的全部操作活動,涵蓋了各類應(yīng)用程序、電子郵件文檔、會議以及觀看電影等。
    的頭像 發(fā)表于 05-07 10:22 ?419次閱讀

    微軟發(fā)布金融聊天機器人,定價尚無確切消息

    在此之前,微軟已推出兩款相對應(yīng)的產(chǎn)品——適用于Office應(yīng)用及Outlook郵箱的Office 365 Copilot,以及專為銷售人員設(shè)計的Copilot for Sales,用以協(xié)助撰寫電子郵件和收集客戶信息等。
    的頭像 發(fā)表于 03-01 09:08 ?504次閱讀

    微軟新聞編輯行業(yè)推出AI工具

    近日,微軟宣布與全球多家知名新聞機構(gòu)展開緊密合作,共同探索并推動生成式AI在新聞編輯室中的創(chuàng)新應(yīng)用。微軟表示,將全力支持新聞機構(gòu)優(yōu)化AI技術(shù)在新聞采編和日常業(yè)務(wù)實踐中的運用,并致力于培
    的頭像 發(fā)表于 02-18 11:08 ?703次閱讀

    smtp服務(wù)器指啥 smtp服務(wù)器用于接收郵件

    SMTP(Simple Mail Transfer Protocol)是一種用于在網(wǎng)絡(luò)中發(fā)送電子郵件的協(xié)議。它定義了郵件的傳輸規(guī)則和相關(guān)的命令。SMTP服務(wù)器是負責(zé)接收、處理和傳遞郵件的服務(wù)器
    的頭像 發(fā)表于 02-02 10:56 ?1319次閱讀

    微軟將在電腦鍵盤上新增AI

    近日,微軟宣布了一項前所未有的舉措:Windows 11電腦添加一個新的AI助手Copilot鍵。這是近30年來,微軟首次在電腦鍵盤上做出
    的頭像 發(fā)表于 01-16 18:16 ?1243次閱讀

    微軟推出Copilot安卓應(yīng)用 類似ChatGPT功能

    微軟在安卓系統(tǒng)上的Copilot應(yīng)用程序與ChatGPT非常相似,可以訪問聊天機器人功能,通過DALL-E 3生成圖像,并可以為電子郵件文檔起草文本。它還包括免費訪問OpenAI最新
    的頭像 發(fā)表于 12-28 16:59 ?1085次閱讀
    <b class='flag-5'>微軟</b>推出Copilot安卓應(yīng)用 類似ChatGPT功能
    RM新时代网站-首页