返回
列表
上一篇
文章
下一篇
文章
四川内容审核的机器怎样进行内容审核的
发布时间:2023.08.08 20:03:41
分享到:

文本内容审核主要包含关键词的检测,语义理解等审核手段。审核平台会根据场景需求维护敏感词库,结合多种文本对抗方法、政策权威要求等关键词库,辅以自然语言处理等人工智能算法,精准地防范违规风险。

在具体的应用场景上,文本内容审核覆盖了错别字检测(如音形相似错误、标点符号错误、句法错误、知识术语错误、搭配错误、常见用语错误)、敏感信息检测(如广告、色情、暴恐、涉政等)、意识形态信息检测(负面人物、落马高官、错误言论等)。

在维护词库或黑白名单的基础上,引入自然语言处理能力,对待审核文本进行语义分析,规避因汉字的组合偶然触发敏感信息导致的误检。

相较于文本内容审核,图像内容审核的流程更为复杂。对图像进行内容审核之前,需要对图像中的信息进行抽取。对于图像中可能出现的诸如敏感人物(负面人物、落马高官、失德艺人等)、异常场景(血腥暴力、特定建筑/旗帜等、黄色低俗、诱导性广告等)维护一定规模的异常人物/场景图片库,当送检图片中包含图片库中包含的敏感元素时,对送检图片进行判断。根据不同的使用场景,可以手动调整检测阈值,合理区分正常图片与敏感图片。

与图像内容审核类似,作为文字的另一种表达形式,音频中也有可能包含敏感信息。对音频进行内容审核之前,需要对音频中的信息进行提取。提取内容包括:音频中包含的文本信息、音频中包含的声纹特征及音色信息,针对音频原始文件质量高低不同,一般情况下还需要对音频文件进行降噪等预处理。



留言反馈
企业名称
所在区域
姓名
电子邮箱
联系电话
问题描述
上传图片