“不不不不,没那么严重!”
潘正教授急忙摆手,制止程旭的思维再发散下去,再发散下去要完蛋了。
“真要那么严重的话,早就被发现了,也不会拖到现在。事实上,那只是在极早期的时候发生的事情。
“后续有了标准的训练流程,语料的选择和清洗也有了明确的选择和标准,模型的成长也非常顺利。
“事实上,言心模型也非常强大,毕竟,这也是数十上百亿资金堆起来的。但是,就是偶尔,对于某些问题,‘言心’偶尔就会冒出一些极为离谱的回答。
“就是因为问题是偶发的,技术人员以为是培养的问题,负责人中途也更换过,所以也就没有往早期训练语料方面去考虑。只是选择了选择纠正训练。纠正的效果其实还是不错的,所以就延续下来了。
“但是,事实证明,根儿坏了,是怎么也无法完全纠正回来的,无论迭代多少次,总是有概率出现哪些极为离谱的回答。”
程旭简直无语,早期的模型就是根基啊,咋能出这样愚蠢的失误呢?
其实也不能完全说是技术人员的问题——早期大家都没有经验,都是在摸着石头过河,出现这样那样的问题都是无法完全避免的。
语料清洗,今天已经是一个标准概念了,专业教材都有讲,还没有毕业的大学生都能明白他的重要意义。
但放在十年前,十年前人工智能刚起步,那个时候,谁能知道语料清洗的重要性?
这都是无数人交了巨额的学费,付出了几乎难以承受的代价,才慢慢得出的宝贵经验。
喜欢科技无垠请大家收藏:(www.jubiquge.com)科技无垠笔趣阁更新速度全网最快。