女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

使用TensorFlow 2識別驗證碼過程中踩過的坑

Tensorflowers ? 來源:TensorFlow ? 作者:TensorFlow ? 2020-10-22 16:47 ? 次閱讀

在學習了 CNN 之后,我一直想去做一個驗證碼識別。網上找了很多資料,雜七雜八的一大堆,但是好多是 tf1 寫的。我對 tf1 不太熟悉,于是自己開始了基于 TensorFlow 2 的摸索實踐。

摸索的過程異常艱難,一開始我直接用 captcha 生成了 10080 張驗證碼去識別,發現 loss 一直停留在 2.3 左右,accuracy 一直是 0.1 左右,訓練了 100 回合,也沒什么提升,電腦都快要跑廢了,咋辦呀?于是網上各種問大佬,找到機會就提問,其中一位大佬的回答讓我受到了啟發,他說:你可以先識別 1 位,然后 2 位,3 位,最后 4 位,一步一步來……。

本文主要描述我在驗證碼識別過程中的一些摸索,整理出來以供大家參考:

第一回:搭建網絡結構

首先我們需要搭建網絡結構,如下:

model=tf.keras.models.Sequential([ tf.keras.Input(shape=(H, W, C)), layers.Conv2D(32, 3, activation='relu'), layers.MaxPooling2D((2, 2)), layers.Conv2D(64, 3, activation='relu'), layers.MaxPooling2D((2, 2)), layers.Conv2D(64, 3, activation='relu'), layers.MaxPooling2D((2, 2)), layers.Conv2D(64, 3, activation='relu'), layers.MaxPooling2D((2, 2)), layers.Conv2D(64, 3, activation='relu'), layers.MaxPooling2D((2, 2)), layers.Flatten(), layers.Dense(1024, activation='relu'), layers.Dense(D * N_LABELS, activation='softmax'), layers.Reshape((D, N_LABELS)), ]) model.compile(optimizer='adam', loss='categorical_crossentropy', metrics= ['accuracy']) callbacks=[ tf.keras.callbacks.TensorBoard(log_dir='logs'), tf.keras.callbacks.ModelCheckpoint(filepath=check_point_path, save_weights_only=True, save_best_only=True) ] history = model.fit(train_gen, steps_per_epoch=len(train_idx)//batch_size, epochs=100, callbacks=callbacks, validation_data=valid_gen, validation_steps=len(valid_idx)//valid_batch_size)

summary:

我的訓練數據量:train count: 7408, valid count: 3176, test count: 4536

樣本圖:

訓練結果:

Train for 231 steps, validate for 99 steps Epoch 1/100 1/231 […] - ETA: 4:18 - loss: 2.2984 - accuracy: 0.1328 231/231 [==============================] - 143s 618ms/step - loss: 2.3032 - accuracy: 0.0971 - val_loss: 2.3029 - val_accuracy: 0.0987 Epoch 2/100 230/231 [============================>.] - ETA: 0s - loss: 2.3026 - accuracy: 0.1014 231/231 [==============================] - 121s 525ms/step - loss: 2.3026 - accuracy: 0.1013 - val_loss: 2.3031 - val_accuracy: 0.0986 Epoch 3/100 230/231 [============================>.] - ETA: 0s - loss: 2.3026 - accuracy: 0.1029 231/231 [==============================] - 138s 597ms/step - loss: 2.3026 - accuracy: 0.1026 - val_loss: 2.3032 - val_accuracy: 0.0986 Epoch 4/100 230/231 [============================>.] - ETA: 0s - loss: 2.3025 - accuracy: 0.1031 231/231 [==============================] - 124s 537ms/step - loss: 2.3025 - accuracy: 0.1031 - val_loss: 2.3032 - val_accuracy: 0.0987 Epoch 5/100 230/231 [============================>.] - ETA: 0s - loss: 2.3025 - accuracy: 0.1040 231/231 [==============================] - 123s 532ms/step - loss: 2.3025 - accuracy: 0.1039 - val_loss: 2.3032 - val_accuracy: 0.0989 Epoch 6/100 230/231 [============================>.] - ETA: 0s - loss: 2.3025 - accuracy: 0.1039 231/231 [==============================] - 118s 509ms/step - loss: 2.3025 - accuracy: 0.1038 - val_loss: 2.3033 - val_accuracy: 0.0988 … Epoch 20/100 230/231 [============================>.] - ETA: 0s - loss: 2.3025 - accuracy: 0.1038 231/231 [==============================] - 120s 521ms/step - loss: 2.3025 - accuracy: 0.1038 - val_loss: 2.3034 - val_accuracy: 0.0988 Epoch 21/100 190/231 [=======================>…] - ETA: 20s - loss: 2.3025 - accuracy: 0.1032

loss 一直沒有變化,accuracy 也很低,不知道出現了什么原因,困擾一兩個星期,都想要放棄了,太難了。但是我不死心,非要把它搞出來,4 位識別不出來,能不能先識別一位呢?好,那就開始搞,一位比較簡單,跟 Mnist 數據集很相似,在這我就不贅述了。

第二回:2 位彩色驗證碼訓練

接著來識別 2 位的驗證碼。train count: 441, valid count: 189, test count: 270

樣本圖:

下面是我用 2 位驗證碼進行訓練的結果:

30 張圖片進行測試,結果:

哎呦,有感覺了,有了起色了,但是出現了過擬合的現象,解決過擬合的方法主要有:

Get more training data

Reduce the capacity of the network

Add weight regularization

Add dropout

Data-augmentation

Batch normalization

第三回:增加彩色驗證碼數據集

于是我就增加了數據集。train count: 4410, valid count: 1890, test count: 2700

然后又出現了 loss 一直在 2.3,accuracy 在 0.09 左右,這是什么鬼呢?但是我還是不死心呀,繼續想辦法呀,既然彩色的有難度,我先識別黑白的樣本行不行呢,先試試吧。

第四回:2 位黑白驗證碼訓練

網絡結構依然采用上面的,input_shape(100,120,3)。

這是我用 2 位的黑白圖片的驗證碼進行了訓練,效果很好,收斂也很快。

訓練第 50 回合時:

Epoch 50/50 26/27 [============>…] - ETA: 0s - loss: 0.0150 - accuracy: 0.9940 27/27 [==============] - 8s 289ms/step - loss: 0.0212 - accuracy: 0.9936 - val_loss: 0.2348 - val_accuracy: 0.9446

隨機選取了 30 張圖片進行了測試,2 張識別錯了:

樣本圖:

看著這結果,我露出了潔白的大牙,信心大增呀,繼續搞,直接上 4 位驗證碼。

第五回:4 位黑白驗證碼訓練

依然采用上面的網絡結構,這次使用的是 4 位黑白圖片的驗證碼。train count: 2469, valid count: 1059, test count: 1512

訓練第 20 回合:

Epoch 20/20 76/77 [====>.] - ETA: 0s - loss: 0.0409 - accuracy: 0.9860 77/77 [======] - 33s 429ms/step - loss: 0.0408 - accuracy: 0.9861 - val_loss: 0.3283 - val_accuracy: 0.9221

隨機選取 30 張圖片進行測試,8 張錯誤:

4 位驗證碼的樣本圖:

從結果來看,有點過擬合,沒關系,繼續加大數據集。

第六回:增加黑白驗證碼數據集

依舊采用上面的網絡結構,這次我增加了數據集 4939 張,依舊使用的是 4 位黑白的驗證碼,訓練結果還是挺好的:train count: 4939, valid count: 2117, test count: 3024

第 20 回合:

Epoch 20/20 153/154 [==>.] - ETA: 0s - loss: 0.0327 - accuracy: 0.9898 154/154 [====] - 75s 488ms/step - loss: 0.0329 - accuracy: 0.9898 - val_loss: 0.1057 - val_accuracy: 0.9740

可以看出 訓練集的準確率 跟驗證集上很接近,隨機選取 30 張圖片進行測試,6 張錯誤圖如下:

好了,搞了這么多,由此我覺得是噪點影響了深度學習的識別,maxpool 的時候連帶著噪點也采樣了,我們需要將噪點處理掉,再喂入神經網絡

第七回:預處理

在上面的推理中,我感覺是噪點影響了神經網絡的識別,于是乎我在送入網絡之前進行了去噪,二值化操作,訓練如下:train count: 4939, valid count: 2117, test count: 3024

從圖中可以看出,模型收斂了,但有點過擬合,第 20 回合訓練結果如下:

Epoch 20/20 153/154 [==>.] - ETA: 0s - loss: 0.0407 - accuracy: 0.9861 154/154 [===] - 69s 450ms/step - loss: 0.0408 - accuracy: 0.9860 - val_loss: 0.3227 - val_accuracy: 0.9244

隨機選取了 30 張圖片進行了測試,8 張錯誤:

做到這里, 我對之前的推測有了猜疑:是噪點影響的嗎?我覺得不完全是。核心原因是我在嘗試的過程中對驗證碼進行了處理,從 RGB 的驗證碼變成了單通道的黑白驗證碼,使得圖片的信息減少了,神經網絡的計算量也大大減少了,網絡模型很快得到了收斂,loss 顯著減少,accuracy 在不斷提高。

整個過程是使用 CPU 進行訓練的,電腦配置是 Intel_Corei7-6700HQ_CPU@_2.60GHz,8G 內存。如果大家的電腦配置高,用 GPU 進行訓練,我覺得即使不做預處理,效果也能出來。


責任編輯:lq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • cnn
    cnn
    +關注

    關注

    3

    文章

    354

    瀏覽量

    22644
  • tensorflow
    +關注

    關注

    13

    文章

    330

    瀏覽量

    61037
  • 驗證碼
    +關注

    關注

    2

    文章

    20

    瀏覽量

    4801

原文標題:經驗總結:使用 TensorFlow 2 識別驗證碼過程中踩過的坑

文章出處:【微信號:tensorflowers,微信公眾號:Tensorflowers】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    HarmonyOS5云服務技術分享--手機號登錄教程

    ;requestPermissions\": [ {\"name\": \"ohos.permission.READ_SMS\"} // 如果需要自動讀取短信驗證碼 ]` 三、核心
    發表于 05-22 15:37

    實驗過程中DLP Discovery 4100開發板的電源撥開關sw4連帶焊盤一塊脫落,怎么解決?

    實驗過程中DLP Discovery 4100開發板的電源撥開關sw4連帶焊盤一塊脫落,請問有什么補救措施嗎?
    發表于 02-28 07:06

    不管是LTC6912還是AFE5801通SPI總線對reg進行寫的時候,在寫的過程中,AFE5801還在工作狀態嗎?

    不管是LTC6912還是AFE5801通SPI總線對reg進行寫的時候,在寫的過程中,AFE5801還在工作狀態嗎?被寫的這個reg里的值是保持在上一時刻寫入的數據還是不定態?現在采用Static PGA模式寫TVG曲線,需要每隔一段時間更新增益值。在寫的
    發表于 02-11 07:24

    手機喇叭氣密性檢測儀選購攻略,避免

    在智能手機的生產過程中,手機喇叭作為其重要的發聲部件,其氣密性直接影響著手機的音質和耐用性。為了確保產品質量,企業需要采用氣密性檢測儀對手機喇叭進行檢測。然而,市場上氣密性檢測儀品牌眾多,價格
    的頭像 發表于 02-05 17:04 ?488次閱讀
    手機喇叭氣密性檢測儀選購攻略,避免<b class='flag-5'>踩</b><b class='flag-5'>坑</b>!

    ADC高速采樣電路設計詳解之STM32

    一、過程 最近用STM32F334做數字電源,用到了高速ADC采集電壓電流。設計的參考電壓VREF為3.3V,輸入信號經運放跟隨后直接接入單片機的采樣通道。一開始測試一切正常,但隨著輸入信號
    的頭像 發表于 12-02 09:27 ?2496次閱讀
    ADC高速采樣電路設計詳解之STM32<b class='flag-5'>踩</b><b class='flag-5'>坑</b>

    TLV1548IDBRG4開發測試過程中發現2pcs失效了,怎么解決?

    最近有個項目生產過程中,有發現2PCS TLV1548IDBRG4 ADC A2通道異常(有做過交叉實驗,不良跟著芯片走),其它通道正常. 如下是項目相關原理圖,幫忙看下導致異常的可能原因: 其中
    發表于 11-19 06:00

    工業視覺在條碼/二維識別領域的應用

    。以下是工業視覺在條碼/二維識別領域的具體應用實例:質量追溯和召回過程簡化:條形碼常用于產品外包裝應用跟蹤,使召回的產品能夠盡快被識別,簡化召回的
    的頭像 發表于 11-18 16:28 ?678次閱讀
    工業視覺在條碼/二維<b class='flag-5'>碼</b><b class='flag-5'>識別</b>領域的應用

    在學習go語言的過程

    作為一個5年的phper,這兩年公司和個人都在順應技術趨勢,新項目慢慢從php轉向了go語言,從2021年到現在,筆者手上也先后開發了兩個go項目。在學習go語言的過程中也學習并總結了一些相關的東西,這篇文章就分享下自己的一
    的頭像 發表于 11-11 09:22 ?410次閱讀

    物聯網產品在生產測試過程中快速讀取貼片SIM卡號的方案

    一、物聯網行業存在的問題 蜂窩通信模組相關的開發項目過程中,經常使用到2mm*2mm, 5mm*6mm物聯網貼片卡,由于貼片卡無法向普通插拔卡那樣, 將卡號打印在卡板上
    的頭像 發表于 09-23 16:14 ?773次閱讀
    物聯網產品在生產測試<b class='flag-5'>過程中</b>快速讀取貼片SIM卡號的方案

    康謀分享 | 在基于場景的AD/ADAS驗證過程中識別挑戰性場景!

    基于場景的驗證是AD/ADAS系統開發過程中的重要步驟,然而面對海量駕駛記錄數據時,如何實現自動且高效地識別、分類和提取駕駛記錄的挑戰性場景?本文康謀為您介紹IVEX軟件
    的頭像 發表于 08-28 10:16 ?1367次閱讀
    康謀分享 | 在基于場景的AD/ADAS<b class='flag-5'>驗證</b><b class='flag-5'>過程中</b>,<b class='flag-5'>識別</b>挑戰性場景!

    DAC7568使用過程中默認的Digital Gain改變了,為什么?

    芯片: DAC7568A , VDD =3.3 V , Ext Ref=2.5V默認的 Digital Gain=1; 使用過程中,Vout范圍為0-2.5V, 但是有時候,Vout變成
    發表于 08-23 07:56

    請問AFE032使用過程中沖和振鈴問題怎么解決?

    在使用AFE032發送信號的過程中,發現在配置TX_PGA以及PA的寄存器時,均會產生一個沖。我們使用并沒有使用AFE032的內部DAC,但是斷開DAC以及AFE032的后級電路,開關TX_PGA以及PA均會產生過沖,請問是器件本身的問題還是寄存器配置的問題呢? AF
    發表于 08-08 06:08

    如何在Tensorflow實現反卷積

    TensorFlow實現反卷積(也稱為轉置卷積或分數步長卷積)是一個涉及多個概念和步驟的過程。反卷積在深度學習領域,特別是在圖像分割、圖像超分辨率、以及生成模型(如生成對抗網絡GANs)等任務
    的頭像 發表于 07-14 10:46 ?1034次閱讀

    電容充放電過程中電壓的變化規律

    電容充放電過程中電壓的變化規律是一個非常重要的電子學課題,涉及到電容器的基本工作原理和特性。在這篇文章,我們將詳細探討電容充放電過程中電壓的變化規律,包括電容的基本特性、充電過程、放
    的頭像 發表于 07-11 09:43 ?9749次閱讀

    tensorflow簡單的模型訓練

    在本文中,我們將詳細介紹如何使用TensorFlow進行簡單的模型訓練。TensorFlow是一個開源的機器學習庫,廣泛用于各種機器學習任務,包括圖像識別、自然語言處理等。我們將從安裝
    的頭像 發表于 07-05 09:38 ?1203次閱讀