王树义:如何用AI大幅提升你的生产力?

王树义 开智学堂

开智君说

[AI时代巨人的工具]系列访谈是 AIGCxChina(中国AIGC产业联盟)发起的公益项目,旨在通过访问形式,以三组 15 个问题,采集梳理各领域专家对于 AI 时代的思考和建议,助力读者提升 AI 时代的生存发展能力。本期文章为本系列主编王树义老师的访谈,他是天津师范大学数据科学系的老师,喜欢分享关于工具和方法的心得。在访谈中,王老师给出了许多关于 AIGC 未来发展的畅想,并介绍了不少实用技巧。

作者:王树义 来源:公众号「AIGCx」

Q1:您认为 AI 会在不远的未来,在哪些方面严重地影响我们的工作和生活,请举例说明。

如果我们不及时调整目前的教学培训方法,AI 可能会阻断普通人从「入门」到「高手」之间的通路。

以我比较熟悉的研究生培养来举例。研究生刚入门的时候,往往会被导师安排做一些辅助性工作,例如说参考文献的梳理,数据获取,规定形式的数据分析等等。这些事情有明确的操作流程和目标,只要认真学习,学生就能够逐渐掌握,并且熟能生巧。

这原本是研究新手积累成就感,并且逐渐从「树木」到「森林」认识科研领域和科研流程的必由之路。但在现在,这些基础性活动,遭受到 AI 的严重挑战。

举例来说,对参考文献进行查询和梳理,AI 已经有了更好的处理方案。例如 Elicit,可以直接帮你找寻相关的领域文献,甚至替你把文献回顾的草稿写出来。

图片

比起让一个刚刚上手的学生去做文献回顾,可能 Elicit 给出结果更加快速,且能更加准确。

以上为一个举例,另外一个是 Open Interpreter 自动分析数据并且给出可视化策略的例子。

图片

从前导师会「逼」着学生掌握 Python 语言,了解各种分析和绘图软件包的使用。但是现在,这些似乎都显得有些多余。你只需要会和 AI 对话就好。

作为研究者,我们看到工具在进化,显著提升科研效率降低成本,想必是很开心的。但这也带来一个问题——每一年新考入的研究生怎么办?他们本来应该上手学习实践的东西,现在完全可以用 AI 来处理。

况且,与学生们相比,AI 是不会喊苦喊累的。就这一问题而言,资深研究者们是否还愿意付出那么多的心力和时间来培养学生,让他们去做 AI 早已能处理好的东西?

可如果没有了扎实的初级基础研究训练,研究生们又如何能够一步步向着专业领域深处迈进呢?打个不恰当的比方,这就好像原先有一个梯子,你只要花功夫爬上去就可以了。只不过现在放眼望去,梯子上挤满了机器人,已经没有你这个人类新手的一席之地。

同样的问题,恐怕也已经出现在绘画、翻译等诸多领域。许多人总在叫嚷「机器换人」的问题。但实际上发生的,并不是这些领域的从业者都丢掉了工作。而是一个资深专家加上一个 AI,可以轻松替换掉 50 甚至 100 个初级员工。短期来看,这有益于企业的降本增效。可是长期来看,新的资深专家,又从哪里训练成长出来呢?

我觉得,无法培养在各个领域的新时代专家才是 AI 给目前职业发展带来的最为显著影响。

Q2:除了人尽皆知的 GPT 和 MJ、SD 等工具外,能否分享一个您用过觉得特别好、而且当前特别看好的 AI 应用?

我第一个想到推荐的,就是 AudioPen(https://audiopen.ai)。这款工具,我是从万维钢老师那里看到的。简单来说,这款工具可以帮助忙碌的知识工作者解决重要痛点 —— 把自己混乱的想法,变成清晰的文字卡片。

图片

此款 AI 应用的工作分为两方面:首先,把音频变成文本;其次,整理和润色转写后的文本。

千万不要小瞧后面这条。大部分的通用大语言模型,都需要你对「整理 + 润色」这个过程用提示词来精确控制。许多 AI 应用在使用过程中会让人沮丧地发现,自己口述出来的内容,被 AI 弄得面目全非、乱七八糟,一赌气就不肯再用这种方式了。

而 AudioPen 根本不需要你来提供那些提示词细节,就帮助你处理了从口述到完成整理中间一系列动作。你还可以指定输出的风格。AudioPen 自己预置了一些风格,如下图所示。

图片

如果输出英文内容,这种内置风格使用起来很方便,勾选即可。但是对于中文文本输出来说,预置的这些英文风格就显得不大匹配了。好在可以直接提供自己之前写作的文本,然后告诉 AudioPen:来,就照着这种方式,给我润色。

图片

然后,你就能看到 AI 模仿你的风格来输出文本了。

图片

以前,在工作上可能需要一个专职秘书帮你随时记录和梳理内容。但现在,这些工作都可以用 AI 来做,省钱省事儿省心。

Q3:能否介绍一个您使用 AI 大幅提升生产力的具体操作案例以及您是如何具体操作的?

我想举一个 AI 帮我用多语种写作和发布文章的例子。

我写完中文文章以后,翻译成其他语种发布会带来更多阅读量,也有助于获得多样化读者群体的反馈。但是我一般写完中文文章已经倦怠了。再手工翻译和校对一篇英文稿件出来,显然比较麻烦。

有了比较靠谱的翻译工具(例如 DeepL 以后),我也兴致勃勃尝试过。只不过,DeepL 翻译纯文本没什么大问题,可一旦带了 Markdown 格式(这是我平时写作使用的格式),就总有不尽如人意之处——它总会在特殊格式(例如代码、图片、链接)的处理上出现问题。

举例来说,我前些日子发布的公众号文章《如果笔记软件公司倒闭了,你的笔记还能接着用吗?》放到 DeepL 翻译,效果是这样的。

图片

我把翻译之后的内容拷贝到 Typora 编辑器,图片全都无法正常显示。

图片

这让我很疑惑,也仔细检查了许久才发现令人哭笑不得的原因——DeepL 居然自作主张,在表示图片链接格式的符号 ! 和 [] 之间,给你平白无故加上一个空格。它大概觉得,这样更加美观,符合英文表达习惯。

为了处理这些细节上的问题,我不得不投入很长的时间进行仔细校对,一两次之后,我就懒得做了。好在这些「人工不智能」的奇怪问题,在新的大语言模型出现后,有了很大改观。

目前,我使用 Claude-2-100K 来翻译 Markdown 格式的中文文章。

图片

同样的一篇文章,Claude-2 的翻译结果,是这样的:

图片

稍加处理,英文译文就能够图文并茂了。

图片

现在,我如果需要把中文博客文章翻译成英文,只需要十几分钟就能搞定。这时间,主要花在等大语言模型缓慢「吐」出字词结果。而在这过程之中,我基本上只需要督促 Claude-2「继续」,其他基本上不需要任何人工干预。

以 Claude-2 和 GPT-4 为代表的 AI 模型,大幅提升了我写作与发布的效率,同时显著降低了成本,让我更有积极性来完成多语种发布工作。■