亚洲视频在线观看视频_欧美一区二区三区_日韩精品免费在线观看_成人片网址_久草免费在线视频_激情欧美一区二区三区中文字幕

軌道交通AFC系統(tǒng)自動(dòng)售票機(jī)語(yǔ)音交互

前言:尋找寫作靈感?中文期刊網(wǎng)用心挑選的軌道交通AFC系統(tǒng)自動(dòng)售票機(jī)語(yǔ)音交互,希望能為您的閱讀和創(chuàng)作帶來(lái)靈感,歡迎大家閱讀并分享。

軌道交通AFC系統(tǒng)自動(dòng)售票機(jī)語(yǔ)音交互

摘要:隨著互聯(lián)網(wǎng)技術(shù)的快速發(fā)展,手機(jī)二維碼支付得到廣泛關(guān)注和研究,這種移動(dòng)支付方式也受到廣大市民乘客的接受和認(rèn)可,通勤乘客對(duì)購(gòu)票終端的需求進(jìn)一步降低。在售票終端總量減少的前提下提升單臺(tái)設(shè)備購(gòu)票速率,豐富和滿足乘客服務(wù)場(chǎng)景,將語(yǔ)音交互所需的語(yǔ)音識(shí)別、語(yǔ)義理解、語(yǔ)音合成引擎進(jìn)行站內(nèi)部署,并部署AI語(yǔ)義結(jié)構(gòu)化可視化開發(fā)平臺(tái),支持購(gòu)票、線網(wǎng)圖查詢、站內(nèi)導(dǎo)航等語(yǔ)義技能的可視化開發(fā),從而不斷提升售票終端語(yǔ)音對(duì)話的智能度,更好服務(wù)乘客需求的作用

關(guān)鍵詞:語(yǔ)音識(shí)別;語(yǔ)義理解;語(yǔ)音合成;語(yǔ)音購(gòu)票

1引言

在大數(shù)據(jù)時(shí)代的背景下,軌道交通行業(yè)正面臨新一輪信息產(chǎn)業(yè)革命的到來(lái),數(shù)字化轉(zhuǎn)型是必然的趨勢(shì)。目前軌道交通網(wǎng)絡(luò)化運(yùn)營(yíng)要求越來(lái)越高,對(duì)傳統(tǒng)afc系統(tǒng)是一種極大的挑戰(zhàn),傳統(tǒng)的自動(dòng)售票機(jī)運(yùn)營(yíng)模式已經(jīng)不能滿足現(xiàn)代化的運(yùn)營(yíng)要求,以互聯(lián)網(wǎng)技術(shù)為基礎(chǔ)的智能支付技術(shù)應(yīng)用在軌道交通行業(yè)將占有越來(lái)越重要的地位,二維碼支付技術(shù)已在自動(dòng)售票機(jī)上得到廣泛應(yīng)用。AFC票務(wù)規(guī)則的復(fù)雜性和業(yè)務(wù)多樣性,還有除售票、檢票、充值以外的大量業(yè)務(wù)需要依賴人工實(shí)現(xiàn),車站客服人員為進(jìn)站、出站人群辦理補(bǔ)票、更新、退票等服務(wù),甚至承擔(dān)了包括問(wèn)詢、指路、兌零等多種職能。隨著移動(dòng)支付、移動(dòng)互聯(lián)網(wǎng)技術(shù)等興起,AFC系統(tǒng)也在積極探索尋求新的發(fā)展途徑,尤其在智慧車站方面更加走向無(wú)人化、智能化。

2軟件功能開發(fā)

2.1智能喚醒

多模態(tài)語(yǔ)音模組集成了人臉檢測(cè)與唇動(dòng)檢測(cè)算法,會(huì)持續(xù)的從攝像頭接收視頻流信息并輸出人臉檢測(cè)結(jié)果,當(dāng)用戶走到設(shè)備前,可以自動(dòng)檢測(cè)到用戶,并通過(guò)唇動(dòng)檢測(cè)進(jìn)一步捕獲用戶開始說(shuō)話和結(jié)束說(shuō)話的節(jié)點(diǎn),從而實(shí)現(xiàn)智能感知用戶主動(dòng)喚醒響應(yīng)用戶說(shuō)話的效果。

2.2語(yǔ)音咨詢

目前我方在天津等城市圍繞智慧客服中心場(chǎng)景的語(yǔ)音咨詢,已開發(fā)出線網(wǎng)圖查詢、站內(nèi)導(dǎo)航、出入口查詢等多種技能,每種技能對(duì)應(yīng)不同的業(yè)務(wù)咨詢,在JSON語(yǔ)義結(jié)果返回時(shí),service字段會(huì)有不同的取值,智慧客服中心終端設(shè)備接到多模態(tài)語(yǔ)音模組通過(guò)串口傳輸?shù)腏SON語(yǔ)義結(jié)果后,客戶端程序可以根據(jù)service字段跳轉(zhuǎn)到不同的業(yè)務(wù)流程頁(yè)面中,生成業(yè)務(wù)回答文本,并調(diào)用語(yǔ)音合成服務(wù)進(jìn)行播報(bào)回答。

2.3語(yǔ)音購(gòu)票

多模態(tài)語(yǔ)音模組通過(guò)人臉檢測(cè)與唇動(dòng)檢測(cè)算法,捕獲開始說(shuō)話和結(jié)束說(shuō)話的節(jié)點(diǎn)后,會(huì)將該時(shí)間段內(nèi)通過(guò)麥克風(fēng)陣列拾音的音頻做降噪處理,并通過(guò)語(yǔ)音交互的SDK與私有云服務(wù)通信進(jìn)行語(yǔ)音識(shí)別、語(yǔ)義理解的處理,獲取購(gòu)票的語(yǔ)義結(jié)果。多模態(tài)語(yǔ)音模組會(huì)通過(guò)串口將語(yǔ)義結(jié)果傳輸?shù)皆O(shè)備工控機(jī),工控機(jī)上運(yùn)行的客戶端程序在接收到JSON結(jié)果時(shí),可根據(jù)當(dāng)前所處的頁(yè)面選擇是否解析JSON執(zhí)行業(yè)務(wù)操作,如當(dāng)前處于首頁(yè),在接收到上述“買天津西站的地鐵票”的JSON結(jié)果時(shí),則跳轉(zhuǎn)到待支付頁(yè)面。

3平臺(tái)部署

3.1調(diào)度服務(wù)部署

采用交互云技術(shù)方案,客戶可通過(guò)調(diào)用參數(shù)來(lái)決定業(yè)務(wù)調(diào)度模型。整體調(diào)度方案整合了我方的語(yǔ)音識(shí)別(IAT),語(yǔ)音合成(TTS)和語(yǔ)義理解(NLU)和用戶個(gè)性化系統(tǒng)等。具備語(yǔ)音交互能力的同時(shí),也具備第三方自定義技能的靈活配置和業(yè)務(wù)拓展的能力。在服務(wù)調(diào)用時(shí),通過(guò)schduler參數(shù)設(shè)置能力調(diào)度順序,如iat,nlp,tts表示識(shí)別?語(yǔ)義?合成,通過(guò)which_ability參數(shù)指定返回結(jié)果,如iat,nlp,tts表示需要返回識(shí)別,語(yǔ)義和合成的結(jié)果,不設(shè)置時(shí)默認(rèn)只返回最后結(jié)果。服務(wù)接入?yún)f(xié)議方面支持WebSocket接入方式,為廠商接入提供方便,降低設(shè)備運(yùn)行要求。服務(wù)接入實(shí)現(xiàn)了全雙工交互,并通過(guò)數(shù)據(jù)壓縮傳輸提升服務(wù)性能,減少帶寬占用。全雙工通信協(xié)議:針對(duì)服務(wù)外部通信,系統(tǒng)設(shè)計(jì)采用WebSocket長(zhǎng)連接通信協(xié)議,對(duì)于服務(wù)內(nèi)部通信,則采用gRPC協(xié)議,從而實(shí)現(xiàn)節(jié)省服務(wù)器資源和帶寬,提高通信效率。數(shù)據(jù)壓縮傳輸:針對(duì)服務(wù)外部音頻數(shù)據(jù)通信,客戶可采用speex等高壓縮率編碼格式,也支持以原始音頻pcm格式傳入。對(duì)于服務(wù)內(nèi)部數(shù)據(jù)調(diào)用,則采用protobuf序列化方式,從而降低流量和傳輸延時(shí)。

3.2語(yǔ)音識(shí)別云服務(wù)部署

語(yǔ)音識(shí)別采用語(yǔ)音和語(yǔ)義多信息融合的短句方案,提升非連貫交互場(chǎng)景中的交互成功率;在基于交互上下文信息的動(dòng)態(tài)解碼方面,使用了篇章級(jí)語(yǔ)言模型的方案。在領(lǐng)域識(shí)別方面,支持不同領(lǐng)域的識(shí)別模型,如在語(yǔ)言近場(chǎng)中覆蓋通用、交通出行、搜索、餐飲、導(dǎo)航、視頻、音樂(lè)和醫(yī)療領(lǐng)域。個(gè)性化識(shí)別方面,支持會(huì)話級(jí)個(gè)性化(帶屏設(shè)備的所見即可說(shuō)),用戶級(jí)個(gè)性化(站內(nèi)信息、站內(nèi)設(shè)施)和應(yīng)用級(jí)個(gè)性化(站點(diǎn)名、景點(diǎn)名、建筑名),全方位多維度支持廠商和用戶的個(gè)性化需求,提升識(shí)別準(zhǔn)確率。1)語(yǔ)音識(shí)別服務(wù)語(yǔ)音識(shí)別聽寫服務(wù)是將語(yǔ)音識(shí)別聽寫引擎服務(wù)化,由于語(yǔ)音識(shí)別引擎為包含眾多功能模塊,都以動(dòng)態(tài)庫(kù)的形式對(duì)外提供,業(yè)務(wù)方如果直接調(diào)用引擎,首先需要了解引擎的基本結(jié)構(gòu)和調(diào)用邏輯,對(duì)引擎進(jìn)行封裝,然后編寫自身的業(yè)務(wù)邏輯模塊,存在著較大的難度和工作量。因此將識(shí)別引擎服務(wù)化,已上層接口的形式對(duì)外提供,提供業(yè)務(wù)方調(diào)用,節(jié)省了業(yè)務(wù)方調(diào)用識(shí)別引擎的復(fù)雜度,只需調(diào)用服務(wù)提供的接口,能夠更多的關(guān)注自身的業(yè)務(wù)調(diào)用邏輯,無(wú)需關(guān)注底層引擎調(diào)用邏輯;同時(shí)也節(jié)省了業(yè)務(wù)方的人力成本,避免各業(yè)務(wù)方的重復(fù)集成。2)負(fù)載均衡(lb)模塊負(fù)載均衡模塊用于向負(fù)載均衡服務(wù)定時(shí)上報(bào)自身信息,包括總的和當(dāng)前正在使用實(shí)例數(shù)等相關(guān)信息,負(fù)載均衡服務(wù)可根據(jù)上報(bào)信息提供給業(yè)務(wù)端最優(yōu)的引擎節(jié)點(diǎn),此模塊支持開啟關(guān)閉,是否啟用。3)實(shí)例管理服務(wù)內(nèi)部采用實(shí)例池的形式來(lái)管理引擎實(shí)例,啟動(dòng)時(shí),會(huì)向引擎申請(qǐng)池大小的引擎實(shí)例數(shù)目,當(dāng)請(qǐng)求會(huì)話數(shù)超過(guò)實(shí)例大小時(shí)會(huì)返回相應(yīng)錯(cuò)誤,此模塊可避免業(yè)務(wù)端向引擎申請(qǐng)過(guò)多實(shí)例導(dǎo)致引擎崩潰。4)會(huì)話管理服務(wù)采用grpc雙向流模式,每一個(gè)流代表一路會(huì)話,在每一路會(huì)話中,服務(wù)會(huì)先解析用戶請(qǐng)求,設(shè)置相應(yīng)參數(shù),接下來(lái)調(diào)用引擎進(jìn)行識(shí)別,解析和封裝引擎返回的結(jié)果,流式返回給客戶端。5)日志模塊服務(wù)包括了日志模塊,目前僅將日志記錄在本地,不具有上傳到日志中心功能。6)個(gè)性化模塊個(gè)性化模塊包括全局個(gè)性化、領(lǐng)域個(gè)性化和用戶個(gè)性化。

3.3語(yǔ)義理解服務(wù)部署

1)語(yǔ)義理解引擎采用獨(dú)創(chuàng)的基于海量弱監(jiān)督數(shù)據(jù)訓(xùn)練的語(yǔ)義關(guān)聯(lián)遷移模型(ATM),基于BILSTM模型進(jìn)行意圖理解和語(yǔ)義抽取,使用通用CNNRank模型對(duì)用戶查詢進(jìn)行語(yǔ)義消歧,采用ABNF文法支持垂直領(lǐng)域定制化的語(yǔ)義理解作為通用BILSTM模型的補(bǔ)充和修正,最終實(shí)現(xiàn)語(yǔ)義提取正確率和召回率達(dá)到平均85%以上,交互完成率達(dá)到平均80%以上。2)自定義技能針對(duì)地鐵領(lǐng)域購(gòu)票、線網(wǎng)圖查詢等業(yè)務(wù)場(chǎng)景,可以通過(guò)自定義技能的方式來(lái)實(shí)現(xiàn)關(guān)鍵信息提取的功能。將當(dāng)?shù)氐罔F各條線路的線路名稱、站點(diǎn)名稱構(gòu)建成線路實(shí)體{lineName}、站點(diǎn)實(shí)體{stationName},并構(gòu)建購(gòu)票數(shù)量的實(shí)體{num},基于用戶購(gòu)票的表述習(xí)慣,融入站點(diǎn)名稱、線路名稱,支持“我要買[{num}]{lineName}的票”、“我要買{stationName}的票”、“我要買{lineName}{stationName}的票”等語(yǔ)料覆蓋,通過(guò)語(yǔ)義的模糊匹配,支持用戶說(shuō)“買2張去XX體育場(chǎng)的地鐵票”這種非嚴(yán)格規(guī)范類的說(shuō)法。地鐵購(gòu)票機(jī)客戶端應(yīng)用,在獲取語(yǔ)義結(jié)果中{num}、{stationName},根據(jù)字段值生成一條購(gòu)票訂單,并在頁(yè)面中顯示支付的二維碼,用戶通過(guò)手機(jī)掃碼,即可快速完成購(gòu)票。3)自定義問(wèn)答支持一問(wèn)一答,一問(wèn)多答,多問(wèn)一答和多問(wèn)多答。通過(guò)自定義問(wèn)答可以將地鐵常見咨詢問(wèn)題中,不易于歸類做自定義技能開發(fā)的問(wèn)題,作為自定義問(wèn)答,從而提升設(shè)備在乘車咨詢問(wèn)題回答的全面性。4)開放問(wèn)答系統(tǒng)默認(rèn)支持9種官方問(wèn)答:抱怨,十萬(wàn)個(gè)為什么,情緒,感情,問(wèn)候,熱點(diǎn),個(gè)性化,夸獎(jiǎng),常識(shí)。開放問(wèn)答可以做閑聊補(bǔ)充,當(dāng)用戶與設(shè)備交互咨詢“喜馬拉雅山有多少”“你真聰明”等問(wèn)題時(shí),設(shè)備也能夠返回回答,增加設(shè)備智能度與趣味性。5)語(yǔ)義理解服務(wù)語(yǔ)義理解服務(wù)是對(duì)語(yǔ)義引擎的封裝,其包含的主要模塊有:語(yǔ)義解析服務(wù):解析引擎,負(fù)責(zé)語(yǔ)義解析,對(duì)一句話進(jìn)行語(yǔ)義理解,并解析為結(jié)構(gòu)化的JSON數(shù)據(jù)返回,是語(yǔ)義理解的核心組件,依賴redis,mongoDB和語(yǔ)義貼弧等服務(wù)。語(yǔ)義貼弧服務(wù):智能貼弧功能可以在輸入語(yǔ)料時(shí)自動(dòng)分析語(yǔ)料各部分所匹配的系統(tǒng)內(nèi)置實(shí)體和輔助詞,能明顯簡(jiǎn)化錄入語(yǔ)料的工作量。編譯引擎:編譯引擎,負(fù)責(zé)將Web頁(yè)面編輯的內(nèi)容編譯成為解析引擎使用的資源。問(wèn)答服務(wù):支持一問(wèn)一答,一問(wèn)多答,多問(wèn)一答和多問(wèn)多答。日志模塊:服務(wù)包括了日志模塊,目前僅將日志記錄在本地,不具有上傳到日志中心功能。

3.4語(yǔ)音合成服務(wù)部署

1)語(yǔ)音合成引擎采用基于原創(chuàng)的聽感量化編碼的統(tǒng)一框架,建立多語(yǔ)言共享的統(tǒng)一建模單元實(shí)現(xiàn)優(yōu)質(zhì)的語(yǔ)音合成文本轉(zhuǎn)換為流暢、清晰、自然和具有表現(xiàn)力的語(yǔ)音數(shù)據(jù)——高質(zhì)量合成音頻的自然度和清晰度已經(jīng)超過(guò)了普通人的朗讀水平。技術(shù)指標(biāo):提供多個(gè)面向智能人機(jī)交互的高表現(xiàn)力語(yǔ)音合成系統(tǒng),相對(duì)傳統(tǒng)信息播報(bào)風(fēng)格語(yǔ)音合成系統(tǒng),在人機(jī)對(duì)話文本領(lǐng)域,以國(guó)際通行的平均主觀意見分MOS(MeanOpinionScore)做人工主觀對(duì)比評(píng)測(cè)(在5分制標(biāo)準(zhǔn),打分間隔0.5分),人機(jī)交互系統(tǒng)的自然度可高出信息播報(bào)系統(tǒng)0.2MOS分,并具有統(tǒng)計(jì)顯著性。2)語(yǔ)音合成服務(wù)語(yǔ)音合成,英文全稱TextToSpeech,簡(jiǎn)稱TTS。主要解決的問(wèn)題是如何將文字信息轉(zhuǎn)化為可聽的聲音信息,涉及聲學(xué)、語(yǔ)言學(xué)、數(shù)字信號(hào)處理、計(jì)算機(jī)科學(xué)等多個(gè)學(xué)科技術(shù),可以“讓機(jī)器像人一樣開口說(shuō)話”。語(yǔ)音合成服務(wù)是對(duì)語(yǔ)音合成引擎的封裝,內(nèi)部調(diào)用通過(guò)gRPC實(shí)現(xiàn)。語(yǔ)音合成服務(wù)除調(diào)用語(yǔ)音合成引擎外,還包括以下功能:

?負(fù)載均衡(lb)模塊:負(fù)載均衡模塊用于向負(fù)載均衡服務(wù)定時(shí)上報(bào)自身信息,包括總的和當(dāng)前正在使用實(shí)例數(shù)等相關(guān)信息,負(fù)載均衡服務(wù)可根據(jù)上報(bào)信息提供給業(yè)務(wù)端最優(yōu)的引擎節(jié)點(diǎn),此模塊支持開啟關(guān)閉,是否啟用。

?會(huì)話管理:服務(wù)采用grpc雙向流模式,每一個(gè)流代表一路會(huì)話,在每一路會(huì)話中,服務(wù)會(huì)先解析用戶請(qǐng)求,設(shè)置相應(yīng)參數(shù),接下來(lái)調(diào)用引擎進(jìn)行合成,解析和封裝引擎返回的結(jié)果,流式返回給客戶端。?日志模塊:服務(wù)包括了日志模塊,目前僅將日志記錄在本地,不具有上傳到日志中心功能。

?多發(fā)音人:發(fā)音人涵蓋男女播音員標(biāo)準(zhǔn)發(fā)音、童聲發(fā)音、機(jī)器發(fā)音、動(dòng)漫人物發(fā)音、中老年發(fā)音、明星發(fā)音等,共227個(gè)發(fā)音人。

?多參數(shù):支持語(yǔ)速、音量、音調(diào)等多種合成參數(shù)調(diào)節(jié)。

4結(jié)論

伴隨著二維碼過(guò)閘功能的進(jìn)一步推個(gè),依然在自動(dòng)售票機(jī)上購(gòu)票乘客的特點(diǎn)將更加鮮明,加強(qiáng)客服群體分析,積極完善設(shè)備、技術(shù)標(biāo)準(zhǔn),并在此基礎(chǔ)上探討多項(xiàng)功能集成可行性是未來(lái)設(shè)備功能優(yōu)化的方向。

參考文獻(xiàn):

[1]吳楠.地鐵語(yǔ)音售票機(jī)方案【R】杭州,2019(01)

[2]張寧.何鐵軍.王建,軌道交通自動(dòng)售檢票系統(tǒng)互換性研究【J】城市軌道交通研究,2007(11)

作者:白玉彬 單位:中國(guó)機(jī)房設(shè)施工程有限公司

主站蜘蛛池模板: 精品久久一区 | 男人的天堂久久 | 毛片天堂| 亚洲第一福利视频 | 精品国产乱码久久久久久蜜柚 | ririsao亚洲国产中文 | 亚洲精品一二区 | 成人精品电影 | 福利电影在线 | 日本三级视频在线播放 | 欧美日韩中文 | 污视频网站免费在线观看 | 国产精品一区二区三区在线 | 羞羞网站免费观看 | 亚洲成av| 成人性视频免费网站 | 国产精品视频专区 | 巨骚综合 | 亚洲欧美激情精品一区二区 | 久久午夜精品影院一区 | 亚洲一区二区精品视频 | 99久久精品免费看国产四区 | 国产一区在线免费 | 久久久久亚洲精品国产 | 一区二区日韩在线观看 | 伊人春色在线播放 | 一区二区久久久 | 小罗莉极品一线天在线 | 美女张开腿视频网站免费 | 国产精品久久久久久妇女6080 | www中文字幕| 国产精品三级在线 | 亚洲视频免费在线观看 | 亚洲高清视频一区二区 | 久久综合一区二区 | av在线免费观看网站 | 黄色一级大片网站 | 欧美一区永久视频免费观看 | 国产精品美女一区二区三区四区 | 成人精品| 亚洲国产日本 |