97MB。作者使用distillation,能夠用9.6MB的MobileNet-v2替換它,尺寸縮小了10倍。所以作者認(rèn)為distillation這種技術(shù)被低估了,它可以為瀏覽器帶來一些很酷的ML功能,因?yàn)楹芏嗄P陀捎谔蠖鵁o法在資源有限的環(huán)境中進(jìn)行部署。" />

RM新时代网站-首页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

用TensorFlow.js在瀏覽器中構(gòu)建了一個使用任意圖像進(jìn)行風(fēng)格化的demo

DPVg_AI_era ? 來源:未知 ? 作者:李倩 ? 2018-11-22 09:33 ? 次閱讀

一位日本小哥用TensorFlow.js在瀏覽器中構(gòu)建了一個使用任意圖像進(jìn)行風(fēng)格化的demo,只使用了一個單一的模型。demo效果相當(dāng)不錯,并且也開源了代碼。

用一個模型就能實(shí)現(xiàn)所有類型的風(fēng)格轉(zhuǎn)換!一個名為Arbitrary Image Stylization in the Browser的項(xiàng)目最近火起來。

作者是日本小哥Reiichiro Nakano,他用TensorFlow.js在瀏覽器中構(gòu)建了一個使用任意圖像進(jìn)行風(fēng)格化的demo。

不像以前的快速風(fēng)格轉(zhuǎn)換算法那樣需要每種風(fēng)格都有一個單獨(dú)的網(wǎng)絡(luò),在這個demo中,所有風(fēng)格圖像只使用一個單一的模型。并且,你可以自由混合不同的風(fēng)格。

使用也非常簡單,你只需要選擇一張內(nèi)容圖像(content image)和一張風(fēng)格圖像(style image),然后點(diǎn)擊“Stylize”,靜候片刻,一張風(fēng)格化的圖像就處理好了。

如圖所示,我們在“內(nèi)容圖像”選擇一張芝加哥城市風(fēng)景圖,“風(fēng)格圖像”選擇一張港口的版畫風(fēng)格圖像,風(fēng)格化后得到一張版畫風(fēng)格的芝加哥風(fēng)景圖。

其中,內(nèi)容圖像和風(fēng)格圖像都可以自定義,也就是說,你可以上傳任意圖像。風(fēng)格化的強(qiáng)度也可以調(diào)整。

作者還提供了混合兩種風(fēng)格的效果。

總結(jié)而言,這個風(fēng)格網(wǎng)絡(luò)被訓(xùn)練并用于為任意繪畫風(fēng)格生成一個100-D的風(fēng)格向量(style vector)。然后,將該向量與內(nèi)容圖像一起饋送到一個的轉(zhuǎn)換網(wǎng)絡(luò),進(jìn)行實(shí)際的風(fēng)格轉(zhuǎn)換。

這個100D的向量基本上是一個“style”的潛在空間。我們可以利用這個“潛在空間”做一些有趣的事情。

我們可以通過對風(fēng)格圖像和內(nèi)容圖像的風(fēng)格向量進(jìn)行加權(quán)平均,來控制風(fēng)格化的強(qiáng)度。作者發(fā)現(xiàn),這對于風(fēng)格特別鮮明的內(nèi)容圖像很有用。

我們還可以通過在它們的風(fēng)格向量之間插值,來組合不同的風(fēng)格,并讓網(wǎng)絡(luò)猜測這兩幅圖像之間的風(fēng)格是什么樣子的。

將模型移植到瀏覽器上的最大問題是模型大小。風(fēng)格網(wǎng)絡(luò)基于Inception-v3,它的權(quán)重> 97MB。作者使用distillation,能夠用9.6MB的MobileNet-v2替換它,尺寸縮小了10倍。所以作者認(rèn)為distillation這種技術(shù)被低估了,它可以為瀏覽器帶來一些很酷的ML功能,因?yàn)楹芏嗄P陀捎谔蠖鵁o法在資源有限的環(huán)境中進(jìn)行部署。

這個demo建立在谷歌大腦和蒙特利爾大學(xué)合作的論文Exploring the structure of a real-time, arbitrary neural artistic stylization network之上,這是圖像風(fēng)格化的經(jīng)典論文之一。作者開源了代碼。

下面我們簡要介紹一下論文的主要思想。

模型和方法

這篇論文的核心是通過構(gòu)建一個風(fēng)格學(xué)習(xí)網(wǎng)絡(luò)來實(shí)現(xiàn)快速的風(fēng)格遷移。

論文提出了一種將藝術(shù)風(fēng)格神經(jīng)算法的靈活性和快速風(fēng)格遷移網(wǎng)絡(luò)的速度相結(jié)合的方法,允許使用任何內(nèi)容/風(fēng)格圖像進(jìn)行實(shí)時的風(fēng)格化。

這個模型成功地用大約80000幅畫作的數(shù)據(jù)庫進(jìn)行了訓(xùn)練,并能夠推廣到以前未見過的畫作。

論文的主要貢獻(xiàn)包括:

1、介紹了一種新的算法,用于快速、任意的藝術(shù)風(fēng)格遷移;在80000幅畫作上訓(xùn)練,并能對未觀察過的畫作實(shí)時運(yùn)行。

2、在緊湊的嵌入空間中呈現(xiàn)左右繪畫風(fēng)格,捕捉繪畫的語義特征。

3、證明用大量畫作進(jìn)行訓(xùn)練之后,模型能夠預(yù)測以前從未觀察過的風(fēng)格。

4、嵌入空間允許對藝術(shù)家的藝術(shù)范圍進(jìn)行新的探索。

圖1:網(wǎng)絡(luò)在大量的繪畫和紋理上訓(xùn)練生成的造型

圖2:模型架構(gòu)圖示

如圖2所示,整個網(wǎng)絡(luò)架構(gòu)由風(fēng)格學(xué)習(xí)網(wǎng)絡(luò)P和風(fēng)格轉(zhuǎn)換網(wǎng)絡(luò)T組成,學(xué)習(xí)的目的是style loss和content loss。風(fēng)格學(xué)習(xí)網(wǎng)絡(luò)P預(yù)測來自輸入風(fēng)格圖像的嵌入向量S,為風(fēng)格轉(zhuǎn)換網(wǎng)絡(luò)提供一組歸一化常數(shù)。風(fēng)格轉(zhuǎn)換網(wǎng)絡(luò)將照片轉(zhuǎn)換為風(fēng)格化的表示。Content loss和style loss來源于VGG圖像分類網(wǎng)絡(luò)的表征空間距離。風(fēng)格學(xué)習(xí)網(wǎng)絡(luò)主要遵循Inception-v3架構(gòu)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 圖像
    +關(guān)注

    關(guān)注

    2

    文章

    1083

    瀏覽量

    40449
  • 瀏覽器
    +關(guān)注

    關(guān)注

    1

    文章

    1022

    瀏覽量

    35330
  • tensorflow
    +關(guān)注

    關(guān)注

    13

    文章

    329

    瀏覽量

    60527

原文標(biāo)題:一個模型搞定所有風(fēng)格轉(zhuǎn)換,直接在瀏覽器實(shí)現(xiàn)(demo+代碼)

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    comicsviewer圖像瀏覽器軟件

    電子發(fā)燒友網(wǎng)站提供《comicsviewer圖像瀏覽器軟件.zip》資料免費(fèi)下載
    發(fā)表于 06-19 17:00 ?0次下載

    TensorFlow發(fā)表推文正式發(fā)布TensorFlow v1.9

    是前所未有的。之前人工智能頭條也為大家介紹了瀏覽器通過TensorFlow.js
    的頭像 發(fā)表于 07-16 10:23 ?3105次閱讀

    利用TensorFlow.js,D3.js 和 Web 的力量使訓(xùn)練模型的過程可視

    TensorFlow.js 將機(jī)器學(xué)習(xí)引入 JavaScript 和 Web。 我們將利用這個很棒的框架來構(gòu)建深度神經(jīng)網(wǎng)絡(luò)模型。這個模型將能夠按大聯(lián)盟裁判的精準(zhǔn)度來稱呼好球和壞球。
    的頭像 發(fā)表于 08-08 14:24 ?6986次閱讀

    如何使用TensorFlow.js構(gòu)建系統(tǒng)

    TensorFlow.js團(tuán)隊(duì)一直在進(jìn)行有趣的基于瀏覽器的實(shí)驗(yàn),以使人們熟悉機(jī)器學(xué)習(xí)的概念,并鼓勵他們將其用作您自己項(xiàng)目的構(gòu)建塊。對于那些不
    的頭像 發(fā)表于 08-19 08:55 ?3553次閱讀

    基于tensorflow.js設(shè)計、訓(xùn)練面向web的神經(jīng)網(wǎng)絡(luò)模型的經(jīng)驗(yàn)

    NVIDIA顯卡。tensorflow.js底層使用了WebGL加速,所以瀏覽器訓(xùn)練模型的
    的頭像 發(fā)表于 10-18 09:43 ?4096次閱讀

    TensorFlow.js瀏覽器中部署可進(jìn)行任意圖像風(fēng)格遷移的模型

    Reiichiro Nakano提供的模型突破了以往模型的局限,它能將任何風(fēng)格圖像分解為表示其風(fēng)格的100維向量,然后把這些向量結(jié)合照片信息起饋送到另
    的頭像 發(fā)表于 11-22 09:01 ?6430次閱讀

    種開源的機(jī)器學(xué)習(xí)模型,可在瀏覽器中使用TensorFlow.js對人物及身體部位進(jìn)行分割

    人物分割有何用途?這項(xiàng)技術(shù)可廣泛應(yīng)用于多個多領(lǐng)域,包括增強(qiáng)現(xiàn)實(shí)、攝影編輯以及圖像或視頻的藝術(shù)效果等。具體應(yīng)用由您決定!去年,當(dāng)我們推出 PoseNet(首個能夠瀏覽器中使用簡易網(wǎng)絡(luò)攝像頭估測身體
    的頭像 發(fā)表于 02-26 16:33 ?5822次閱讀

    TensorFlow.js制作了僅用 200 余行代碼的項(xiàng)目

    我們先來看下運(yùn)行的效果。下圖中,上半部分是原始視頻,下半部分是使用 TensorFlow.js 對人像進(jìn)行消除后的視頻??梢钥吹?,除了偶爾會在邊緣處留有殘影之外,整體效果還是很不錯的。
    的頭像 發(fā)表于 05-11 18:08 ?5588次閱讀

    CNN是什么?美國有線電視新聞網(wǎng)嗎?

    它用TensorFlow.js加載了10層的預(yù)訓(xùn)練模型,相當(dāng)于在你的瀏覽器上跑CNN模型
    的頭像 發(fā)表于 09-03 10:58 ?6087次閱讀
    CNN是什么?美國有線電視新聞網(wǎng)嗎?

    如何基于 ES6 的 JavaScript 進(jìn)行 TensorFlow.js 的開發(fā)

    環(huán)境,如果有 CUDA 環(huán)境支持,或者瀏覽器環(huán)境,有 WebGL 環(huán)境支持,那么 TensorFlow.js 可以使用硬件
    的頭像 發(fā)表于 10-31 11:16 ?3116次閱讀

    關(guān)于瀏覽器緩存最詳細(xì)解析

    瀏覽器緩存即 http 緩存,將請求過的數(shù)據(jù)(html、css、js)存在瀏覽器(本地磁盤),當(dāng)再次訪問這些資源時可以從本地直接加載,減少服務(wù)端請求。
    的頭像 發(fā)表于 04-16 16:01 ?2717次閱讀

    CNN到底是怎么回事?

    它用TensorFlow.js加載了10層的預(yù)訓(xùn)練模型,相當(dāng)于在你的瀏覽器上跑CNN模型
    的頭像 發(fā)表于 06-28 14:47 ?4063次閱讀
    CNN到底是怎么回事?

    怎么js保存數(shù)據(jù)

    JS保存數(shù)據(jù)是Web開發(fā)中非常重要的功能,它能夠?qū)⒂脩舻妮斎牖蛘咂渌麛?shù)據(jù)存儲瀏覽器,隨后
    的頭像 發(fā)表于 11-27 16:10 ?1056次閱讀

    js文件可以直接瀏覽器運(yùn)行嗎

    載和運(yùn)行。 Web開發(fā)JS常被用于實(shí)現(xiàn)動態(tài)交互效果和頁面邏輯控制。通過將JS代碼嵌入到網(wǎng)頁的HTML文件
    的頭像 發(fā)表于 11-27 16:45 ?4057次閱讀

    js腳本怎么瀏覽器運(yùn)行

    瀏覽器運(yùn)行JavaScript腳本是種常見的方式,因?yàn)镴avaScript是Web
    的頭像 發(fā)表于 11-27 16:46 ?2813次閱讀
    RM新时代网站-首页