网页中文本朗读功能开发实现分享
2017-12-13 16:12:53 来源:易采站长用户投稿 作者:admin
头几天完成了一个需供,正在网页中完成鼠标指背那里,便用语音读出所指的文本。假如是按钮、链接、文本输进框,则借借要给出是甚么的提示。同时针对年夜段的文本,不克不及整段的来读,要根据标面标记停止断句处置。
重面固然便是先获得到当前标签上的文本,再把文本转化成语音便可。
标签朗诵
那个很简朴了,只用按照当前是甚么标签,给出提醒便可。
// 标签朗诵文本
var tagTextConfig = {
'a': '链接',
'input[text]': '文本输进框',
'input[password]': '稀码输进框',
'button': '按钮',
'img': '图片'
};
借有需求朗诵的标签,持续再增加便可。
然后按照标签,返回前缀文本便可。
/**
* 获得标签朗诵文本
* @param {HTMLElement} el 要处置的HTMLElement
* @returns {String} 朗诵文本
*/
function getTagText(el) {
if (!el) return '';
var tagName = el.tagName.toLowerCase();
// 处置input等多属性元素
switch (tagName) {
case 'input':
tagName += '[' + el.type + ']';
break;
default:
break;
}
// 标签的功用提示战做用该当有距离,因而正在最初参加一个空格
return (tagTextConfig[tagName] || '') + ' ';
}
获得完好的朗诵文本便更简朴了,先与标签的功用提示,再与标签的文本便可。
文本内容劣先与 title 其次 alt 最初 innerText。
/**
* 获得完好朗诵文本
* @param {HTMLElement} el 要处置的HTMLElement
* @returns {String} 朗诵文本
*/
function getText(el) {
if (!el) return '';
return getTagText(el) + (el.title || el.alt || el.innerText || '');
}
那样便能够获得到一个标签的功用提示战内容的局部带朗诵文本了。
注释分开
接下去要处置的便是注释分开了,正在那个历程中,踩了很多坑,走了很多直路,好好记载一下。
尾先筹办了注释分开的设置:
// 注释拆分派置
var splitConfig = {
// 内容分段标署名称
unitTag: 'p',
// 注释平分隔正则表达式
splitReg: /[,;,;。]/g,
// 包裹标署名
wrapTag: 'label',
// 包裹标签类名
wrapCls: 'speak-lable',
// 下明款式名战款式
hightlightCls: 'speak-help-hightlight',
hightStyle: 'background: #000!important; color: #fff!important'
};
最开端念的便是间接根据注释中的分开标面标记停止分开便好了呀。
念法以下:
获得段降局部文本
利用 split(分开正则表达式) 办法将注释根据标面标记分开成小段
每一个小段用标签包裹放归去便可
但是幻想很饱满,理想很骨感。
两个年夜坑以下:
split 办法停止分开,分开后分开字符便拾了,也便是道把本文的一些标面标记给弄拾了。
假如段降内借存正在其他标签,而那个标签内部也恰好存正在待分开的标面标记,那包裹分段标签时间接破换了本标签的完好性。
闭于第一个成绩,丧失标面的标记,思索过逐一标面去停止战交换 split 分开办法为逐一字符轮回去做。
前者成绩是本来一次完成的事情分红了屡次,服从太低。第两种觉得服从更低了,分开原来是很稠密的,可是却要酿成逐一字符出判定处置,更枢纽的是,分开标面的地位要插进包裹标签,会招致字符串少度变革,借要处置下标索引。代码是机械跑的,大概没有会以为烦,可是我实的以为好烦。假如那么干,大概当前哪一个AI大概同事看到那样的代码,道没有定会道“那实是个愚xxxx”。
第两个成绩念过许多法子去弥补,如先利用正则婚配捕捉内容中成对的标签,对标签内部的分开先处置一遍,然后再处置全部的。
念没有大白成绩两的,可参考一下待分开的段降:
那是一段测试文本,那里有个链接。您好,能够面击此处停止跳转借有其他内容其他内容容其他内容容其他内容,容其他内容。
如先利用/<((w+?)>)(.+?)</2(?=>)/g 正则,顺次捕捉段降内被标签包裹的内容,对标签内部的内容先处置。
可是成绩又去了,那么处置的皆是字符串,正在js中皆是根本范例,那些操纵停止的时分皆是正在复造的根底长进止的,要修正到本字符串里来,借得记载下本来的开端完毕地位,再将新的插出来。繁,借是繁,可是曾经比之前逐一字符来遍历的好,正则捕捉中原来便有了婚配的索引,间接用便可,借能承受。
可是那只是处置了段降内部标签的成绩,段降内必定借有许多文本是出有处置呢,怎样办?
正则婚配到了只是段降内标签的成果啊,里面的出有啊。哦,对,有婚配到的索引,前次婚配到的地位减上前次处置的少度,便是一段间接文本的开端。下一次婚配到的索引-1便是那段间接文本的完毕。那只是婚配历程中的,借有尾尾要零丁处置。又回到烦的老路上来了。。。
那么烦,一个段降分开能那么烦琐,我没有疑!
忽然念到了,有文本节面那么个工具,删繁便简嘛,正则先到边上来,间接处置段降的一切节面没有便止了。
文本节面则分开间接包裹,标签节面则对内容停止包裹,那种状况下处置的间接是dom,更费事。
文本节面里放标签?那是正在开顽笑么,是也没有是。文本节面里的确只能放文本,可是我把标签间接放出来,它会主动转义,那最初再交换出去没有便止了。
好了,计划末于有了,并且那个计划逻辑多简朴,代码逻辑天然也没有会烦。
/**
* 注释内容分段处置
* @param {jQueryObject/HTMLElement/String} $content 要处置的注释jQ工具或HTMLElement或其对应挑选器
*/
function splitConent($content) {
$content = $($content);
$content.find(splitConfig.unitTag).each(function (index, item) {
var $item = $(item),
text = $.trim($item.text());
if (!text) return;
var nodes = $item[0].childNodes;
$.each(nodes, function (i, node) {
switch (node.nodeType) {
case 3:
// text 节面
// 因为是文本节面,标签被转义了,后绝再转返来
node.data = '<' + splitConfig.wrapTag + '>' +
node.data.replace(splitConfig.splitReg, '$&<' + splitConfig.wrapTag + '>') +
'';
break;
case 1:
// 元素节面
var innerHtml = node.innerHTML,
start = '',
end = '';
// 假如内部借有间接标签,先来失落
var startResult = /^<w+?>/.exec(innerHtml);
if (startResult) {
start = startResult[0];
innerHtml = innerHtml.substr(start.length);
}
var endResult = /</w+?>$/.exec(innerHtml);
if (endResult) {
end = endResult[0];
innerHtml = innerHtml.substring(0, endResult.index);
}
// 更新内部内容
node.innerHTML = start +
'<' + splitConfig.wrapTag + '>' +
innerHtml.replace(splitConfig.splitReg, '$&<' + splitConfig.wrapTag + '>') +
'' +
end;
break;
default:
break;
}
});
// 处置文本节面中被转义的html标签
$item[0].innerHTML = $item[0].innerHTML
.replace(new RegExp('<' + splitConfig.wrapTag + '>', 'g'), '<' + splitConfig.wrapTag + '>')
.replace(new RegExp('</' + splitConfig.wrapTag + '>', 'g'), '');
$item.find(splitConfig.wrapTag).addClass(splitConfig.wrapCls);
});
}
上里代码中最初对文本节面中被转义的包裹标签交换仿佛有面费事,可是出法子,ES5之前JavaScript其实不撑持正则的后止断行(也便是正则表达式中“后瞅”)。以是出法子对包裹标签前后的 < 战 > 停止粗准交换,只能连同标署名一同交换。
变乱处置
正在上里完成了文本获得战段降分开,上面要做的便是鼠标挪动上来时获得文本触收朗诵便可,移开时截至朗诵便可。
鼠标挪动,只读一次,基于那两面本果,利用 mouseenter 战 mouseleave 变乱去完成。
本果:
没有冒泡,没有会触收女元素的再次朗诵
没有反复触收,一个元素内挪动时没有会反复触收。
/**
* 正在页里上写进下明款式
*/
function createStyle() {
if (document.getElementById('speak-light-style')) return;
var style = document.createElement('style');
style.id = 'speak-light-style';
style.innerText = '.' + splitConfig.hightlightCls + '{' + splitConfig.hightStyle + '}';
document.getElementsByTagName('head')[0].appendChild(style);
}
// 非注释需求朗诵的标签 逗号分开
var speakTags = 'a, p, span, h1, h2, h3, h4, h5, h6, img, input, button';
$(document).on('mouseenter.speak-help', speakTags, function (e) {
var $target = $(e.target);
// 解除段降内的
if ($target.parents('.' + splitConfig.wrapCls).length || $target.find('.' + splitConfig.wrapCls).length) {
return;
}
// 图片款式零丁处置 其他款式同一处置
if (e.target.nodeName.toLowerCase() === 'img') {
$target.css({
border: '2px solid #000'
});
} else {
$target.addClass(splitConfig.hightlightCls);
}
// 开端朗诵
speakText(getText(e.target));
}).on('mouseleave.speak-help', speakTags, function (e) {
var $target = $(e.target);
if ($target.find('.' + splitConfig.wrapCls).length) {
return;
}
// 图片款式
if (e.target.nodeName.toLowerCase() === 'img') {
$target.css({
border: 'none'
});
} else {
$target.removeClass(splitConfig.hightlightCls);
}
// 截至语音
stopSpeak();
});
// 段降内文本朗诵
$(document).on('mouseenter.speak-help', '.' + splitConfig.wrapCls, function (e) {
$(this).addClass(splitConfig.hightlightCls);
// 开端朗诵
speakText(getText(this));
}).on('mouseleave.speak-help', '.' + splitConfig.wrapCls, function (e) {
$(this).removeClass(splitConfig.hightlightCls);
// 截至语音
stopSpeak();
});
留意要把针对段降的语音处置战其他处所的分隔。为何? 果为段降是个块级元素,鼠标移进段降中的空缺时,如:段降前后空缺、尾止缩进、终止盈余空缺等,是不该该触收朗诵的,假如没有阻遏失落,停止那些地区将间接触收整段笔墨的朗诵,落空了我们对段降文本内分开的意义,并且,不管甚么方法转化语音皆是要工夫的,年夜段内容能够需求较少工夫,影响语音输出的体验。
文本分解语音
上里我们是间接利用了 speakText(text) 战 stopSpeak() 两个办法去触收语音的朗诵战截至。
我们去看下怎样真现那个两个功用。
实在当代阅读器默许曾经供给了上里功用:
var speechSU = new window.SpeechSynthesisUtterance();
speechSU.text = '您好,天下!';
window.speechSynthesis.speak(speechSU);
复造到阅读器掌握台看看能不克不及听到声音呢?(需求Chrome 33+、Firefox 49+ 或 IE-Edge)
操纵一下两个API便可:
SpeechSynthesisUtterance 用于语音分解
lang : 言语 Gets and sets the language of the utterance.
pitch : 音下 Gets and sets the pitch at which the utterance will be spoken at.
rate : 语速 Gets and sets the speed at which the utterance will be spoken at.
text : 文本 Gets and sets the text that will be synthesised when the utterance is spoken.
voice : 声音 Gets and sets the voice that will be used to speak the utterance.
volume : 音量 Gets and sets the volume that the utterance will be spoken at.
onboundary : 单词或句子鸿沟触收,即分开处触收 Fired when the spoken utterance reaches a word or sentence boundary.
onend : 完毕时触收 Fired when the utterance has finished being spoken.
onerror : 毛病时触收 Fired when an error occurs that prevents the utterance from being succesfully spoken.
onmark : Fired when the spoken utterance reaches a named SSML "mark" tag.
onpause : 久停时触收 Fired when the utterance is paused part way through.
onresume : 从头播放时触收 Fired when a paused utterance is resumed.
onstart : 开端时触收 Fired when the utterance has begun to be spoken.
SpeechSynthesis : 用于朗诵
paused : Read only 能否久停 A Boolean that returns true if the SpeechSynthesis object is in a paused state.
pending : Read only 能否处置中 A Boolean that returns true if the utterance queue contains as-yet-unspoken utterances.
speaking : Read only 能否朗诵中 A Boolean that returns true if an utterance is currently in the process of being spoken — even if SpeechSynthesis is in a paused state.
onvoiceschanged : 声音变革时触收
cancel() : 状况待朗诵行列 Removes all utterances from the utterance queue.
getVoices() : 获得阅读器撑持的语音包列表 Returns a list of SpeechSynthesisVoice objects representing all the available voices on the current device.
pause() : 久停 Puts the SpeechSynthesis object into a paused state.
resume() : 从头开端 Puts the SpeechSynthesis object into a non-paused state: resumes it if it was already paused.
speak() : 读分解的语音,参数必需为SpeechSynthesisUtterance的真例 Adds an utterance to the utterance queue; it will be spoken when any other utterances queued before it have been spoken.
具体api战阐明可参考:
MDN - SpeechSynthesisUtterance
MDN - SpeechSynthesis
那末上里的两个办法能够写为:
var speaker = new window.SpeechSynthesisUtterance();
var speakTimer,
stopTimer;
// 开端朗诵
function speakText(text) {
clearTimeout(speakTimer);
window.speechSynthesis.cancel();
speakTimer = setTimeout(function () {
speaker.text = text;
window.speechSynthesis.speak(speaker);
}, 200);
}
// 截至朗诵
function stopSpeak() {
clearTimeout(stopTimer);
clearTimeout(speakTimer);
stopTimer = setTimeout(function () {
window.speechSynthesis.cancel();
}, 20);
}
果为语音分解原来是个同步的操纵,因而正在历程中停止以上处置。
当代阅读器曾经内置了那个功用,两个API接心兼容性以下:
Feature
Chrome
Edge
Firefox (Gecko)
Internet Explorer
Opera
Safari
(WebKit) Basic
support 33
(Yes)
49 (49)
No support
?
7
假如要兼容其他阅读器大概需求一种完善兼容的处理计划,能够便需求效劳端完成了,按照给定文本,返回响应语音便可,百度语音 http://yuyin.百度.com/docs便供给那样的效劳。













闽公网安备 35020302000061号