Courps语料库建立

所属课程: 即将进入我们生活的机器人(16星期,32课时)
发布于:2023-04-21
浏览数:479

项目1. 人工智能历史老师语料库

(1)可以加入历史文献、论文资料等等

(2)为了贴近语言习惯,可以加入一些基本语料

(3)要加入课本中的内容,同时把各种对史实的评价也跟着加入

(4)可以对录入信息的性质进行区分,如《三国演义》中的虚构段落可加上备注标签,告诉使用者这不是史实

 

项目2.关于一个B站UP主的语料库

首先,这应该是一个可以实时爬取信息的语料库,这样才可以跟上最新的信息 、动态

以@在下曼妥思(以下称阿思)为例 我们可以加入他的基础信息 同时应该加入一些保证对话通顺的基础语料

那么,在此基础上就可以给AI限制一个爬取信息的范围,比如阿思的动态等等

同时,要确定这个AI的用处是关于阿思的问答,那么针对部分问题AI需要做出对他的一些评价

这就需要加入关于人物评价的语料了

AI还可以爬取他的视频,提取语料作为自主训练

因为阿思是一个文物修复区UP,如果提关于专业手法的问题,AI应该做出详尽完整的答复

这就需要把领域内的专业信息录入进去了

 

你还没有登录,请先登录注册
  • 还没有人评论,欢迎说说您的想法!