大胆欧美熟妇BBXX,免费的视频下载软件,日韩理论狠狠干

1Whisper簡介

Whisper是OpenAI開源的，識別語音識別能力已達到人類水準自動語音識別系統。Whisper作為一個通用的語音識別模型，它使用了大量的多語言和多任務的監督數據來訓練，能夠在英語語音識別上達到接近人類水平的魯棒性和準確性。Whisper還可以進行多語言語音識別、語音翻譯和語言識別等任務。Whisper的架構是一個簡單的端到端方法，采用了編碼器-解碼器的Transformer模型，將輸入的音頻轉換為對應的文本序列，并根據特殊的標記來指定不同的任務。

本教程針對語音識別Whisper的訓練和部署到EASY-EAI-Orin-nano(RK3576)進行說明。

接下來對算法流程進行說明，whisper算法系統流程如下圖所示:

預處理器流程：

編碼器流程：

解碼器流程：

2Whisper模型訓練

Whisper工程下載百度網盤下載鏈接：

https://pan.baidu.com/s/1rX422_7AUMNB_MvZRKL9CQ?pwd=1234(提取碼: 1234）

數據集準備

在本例中，whisper-finetuning工程為whisper模型微調訓練工程，該工程提供whisper數據轉換，模型微調訓練代碼。本章節將以AiShell數據集演示whisper模型微調訓練過程。

其中AiShell下載鏈接：

https://openslr.magicdatatech.com/resources/33/

AiShell數據轉SRT

在本例中我們提供了AiShell數據集轉成SRT的python腳本，請根據示例修改腳本內容，其中：

1. aishell_extract.py 解壓AiShell數據集，解壓后：

data_aishell

├── transcript

│ └── aishell_transcript_v0.8.txt

└── wav

├── dev

├── test

└── train

2. aishell2srt.py 將解壓后的AiShell數據集轉成SRT格式，其格式如下：

datas/data_aishell/wav/test/S0907/BAC009S0907W0352.wav 作為此次賽事上唯一一場純泰式規則的超級戰

datas/data_aishell/wav/test/S0907/BAC009S0907W0269.wav 蘋果正在全力以赴出售盡可能多的智能手機

datas/data_aishell/wav/test/S0907/BAC009S0907W0147.wav 從業人員五萬人

datas/data_aishell/wav/test/S0907/BAC009S0907W0495.wav 港媒稱內地人不窮了為何仍愛搶學者搶習慣了

3. 在本例中我們提供了create_data.py，將SRT數據轉成訓練數據，執行命令：

python create_data.py --data-file --language --output train.json

#suchas:

python create_data.py --data-file datas/data_aishell/train.txt --language zh --output train.json

轉換后數據格式如下：

{"audio_path": "datas/data_aishell/wav/test/S0907/BAC009S0907W0352.wav", "text":"作為此次賽事上唯一一場純泰式規則的超級戰", "language": "zh", "prompt":""}

{"audio_path": "datas/data_aishell/wav/test/S0907/BAC009S0907W0269.wav", "text": "蘋果正在全力以赴出售盡可能多的智能手機", "language": "zh", "prompt":""}

{"audio_path": "datas/data_aishell/wav/test/S0907/BAC009S0907W0147.wav", "text": "從業人員五萬人", "language": "zh", "prompt":""}

{"audio_path": "datas/data_aishell/wav/test/S0907/BAC009S0907W0495.wav", "text": "港媒稱內地人不窮了為何仍愛搶學者搶習慣了", "language": "zh", "prompt":""}

模型訓練

在本例中我們提供了run_finetuning.py用于模型訓練，執行命令如下：

python run_finetuning.py --train-json --dev-json --model --save-dir

注：其中model可以為tiny, base, small, medium等值，程序會自動下載對應的模型；如果，model的值為本地模型文件，則程序會直接加載本地模型進行微調訓練。訓練好的模型將保存在save-dir目錄下。

PT模型轉ONNX

convert工程為whisper模型轉換工程，提供了將pt模型轉rknn過程的所有腳本。在本例中我們提供了export_onnx.py腳本將pt模型轉成onnx，轉換命令：

pip install openai-whisper==20231117

python export_onnx.py --model_type

注：

model_type可以為tiny, base, small, medium等值，程序會自動下載對應的模型。如果model的值為本地模型文件，則程序會直接加載本地模型進行轉換。同時，onnx模型保存地址需要修改export_onnx.py代碼。

3rknn-toolkit模型轉換

rknn-toolkit模型轉換環境搭建

onnx模型需要轉換為rknn模型才能在EASY-EAI-Orin-nano運行，所以需要先搭建rknn-toolkit模型轉換工具的環境。當然tensorflow、tensroflow lite、caffe、darknet等也是通過類似的方法進行模型轉換，只是本教程onnx為例。

概述

模型轉換環境搭建流程如下所示：

? ? ?

下載模型轉換工具

為了保證模型轉換工具順利運行，請下載網盤里“06.AI算法開發/01.rknn-toolkit2模型轉換工具/rknn-toolkit2-v2.3.0/docker/rknn-toolkit2-v2.3.0-cp38-docker.tar.gz”。

網盤下載鏈接:

https://pan.baidu.com/s/1J86chdq1klKFnpCO1RCcEA?pwd=1234(提取碼：1234)

把工具移到ubuntu20.04

把下載完成的docker鏡像移到我司的虛擬機ubuntu20.04的rknn-toolkit2目錄,如下圖所示：

運行模型轉換工具環境

在該目錄打開終端

執行以下指令加載模型轉換工具docker鏡像:

docker load --input rknn-toolkit2-v2.3.0-cp38-docker.tar.gz

執行以下指令進入鏡像bash環境:

docker run -t -i --privileged -v /dev/bus/usb:/dev/bus/usb rknn-toolkit2:2.3.0-cp38 /bin/bash

現象如下圖所示:

輸入“python”加載python相關庫，嘗試加載rknn庫，如下圖環境測試成功:

至此，模型轉換工具環境搭建完成。

模型轉換為RKNN

EASY EAI Orin-nano支持.rknn后綴的模型的評估及運行，對于常見的tensorflow、tensroflow lite、caffe、darknet、onnx和Pytorch模型都可以通過我們提供的 toolkit 工具將其轉換至 rknn 模型，而對于其他框架訓練出來的模型，也可以先將其轉至 onnx 模型再轉換為 rknn 模型。模型轉換操作流程入下圖所示：

? ? ?

模型轉換Demo下載

下載百度網盤鏈接：

https://pan.baidu.com/s/1C1lQN1U9YhKwpi6PwuyxxA?pwd=1234(提取碼: 1234)

把whisper_convert_rk3576.tar.bz2解壓到虛擬機，如下圖所示:

進入模型轉換工具docker環境

執行以下指令把工作區域映射進docker鏡像，其中，/home/developer/rknn-toolkit2/model_convert_test為工作區域，/test為映射到docker鏡像，/dev/bus/usb:/dev/bus/usb為映射usb到docker鏡像

docker run -t -i --privileged -v /dev/bus/usb:/dev/bus/usb -v /home/developer/rknn-toolkit2/model_convert_test:/test rknn-toolkit2:2.3.0-cp38 /bin/bash

執行成功如下圖所示: