最近这两年,播客作为一种新兴的音频内容形式,越来越热门了,我也琢磨着把公众号积累的上千篇原创文章转化成播客形式,打开“听”的世界。
一个好的播客应该更有人情味,要有主持人,要能够用对话的方式来深入探讨文章的内容,而不是机械地念稿子。这就意味着现有的内容是不行的,势必要重新创作。
幸运的是,人工智能可以干这件事情,比如NotebookLM,就可以把一篇文章转成两人对话的语音,听起来非常自然,但是它似乎只支持英文,并且无法调整各种声音参数,不灵活。
于是我就打算自己开发一个AI应用来做这件事儿,实现声音定制、生成封面,然后一键生成播客,但是找来找去,发现现有的AI应用全是用对话式交互的,这种方式只适合简单场景,没法满足我的需求。
我希望能通过可视化的方式来开发AI应用,用拖拽方式来构建GUI界面,通过工作流实现业务逻辑,这样能极大地降低工作量,每个人都能开发AI应用。
真正的零代码,可视化的应用开发,不得不提我一直在关注的扣子(coze.cn)平台,它在开发智能体和工作流等方面的能力让人印象非常深刻,是国内AI应用开发平台的佼佼者。
01
扣子Project IDE重磅发布
上个月,扣子发布了一个重磅新功能:Project IDE。
别的平台都是基于大模型,再加上各种插件,用自然语言交互的方式来创建AI智能体。
但是扣子除了支持插件,工作流,知识库之外,竟然还有一个UI Builder!
也就是说,终于不再是一轮一轮的对话了,我可以用大家熟悉的按钮、列表、文本、图片来构建应用,调用大模型了。
70后/80后可能马上就能想到90年代的开发桌面神器:Visual Basic。
这是我当年非常喜欢的一个开发工具,拖拽式开发,基于事件的处理逻辑,应用开发起来非常迅速。
这个扣子的Proejct IDE简直就像当时的Visual Basic啊!
用UI Builder来设计开发界面,用工作流来调用大模型、插件、知识库,这就相当于前后端通吃了,一个人就可以快速开发出一个AI应用了。
02
搭建AI应用
看到扣子的Project IDE以后,我就迫不及待地用它开发了一个AI应用,用户界面大概是这样(基本的元素都有了,请原谅一个程序员不怎么样的审美):
界面的左边可以输入文章的链接,选定男声风格(阳光青年/温暖男声)和女声风格(柔美女声/高冷御姐),选定封面风格(通用/人像/动漫),然后点击“开始”按钮就可以转换了。
之所以同时需要男声和女声,是因为播客不是单纯的念文章,而是以男女对话的方式进行。
界面的右边会用Markdown组件展示生成的音频链接,用图片组件展示播客的封面图。
使用扣子的UI Builder,用拖拽的方式把各种UI组件放进来就行,几分钟的时间就可以把这个界面给“画”出来,就像当年的VB一样,非常简单直观,这里就不再花时间详细介绍了。
先听一下转换好的两人对话的播客吧:
03
开发工作流
界面的搭建比较简单,文章转播客的逻辑实现也并不复杂,主要用扣子的工作流来实现,具体的流程是这样的:
可以看出,几乎所有工作都是工作流调用大模型或者插件来完成的,只需要考虑输入输出就可以,几乎不需要怎么编程,非程序员也能做。
扣子的工作流支持各种各样的节点,除了大模型和海量插件外,还可以访问变量、数据库、知识库、文本处理、长期记忆。如果逻辑确实很复杂,甚至可以写代码。
例如,读取文章内容,可以直接用“链接读取”这个插件,告诉它URL就行:
生成两人对话台词,就可以用豆包大模型来做,把系统提示词写好就行:
值得注意的是,“生成节目台词”这个节点的输入就是“读取网页内容”节点的输出。
在工作流中,它们是链接在一起的,在下图中可以很直观地体现出来。
最后的流程是这个样子的,看起来有些复杂,其实很快就可以设置好。
04
连接起来
当界面和工作流开发完成以后,需要把它们连接起来,这个过程也很简单,在我们的例子中,当点击“开始”按钮时,就需要调用工作流实现文章到音频和封面图的转换。
工作流需要的输入参数(文章URL、男声风格、女声风格、封面风格)和界面上对应的组件一一绑定即可。
工作流的输出是音频URL和图片URL,同样可以绑定到界面的对应组件上。
接下来就可以进行一个“试运行”了,看看这个AI应用怎么样,如果没有问题,可以直接发布,让大家都可以使用。
05
总结
可以看出,扣子的UI Builder可以轻松地把界面“画出来”,再通过和工作流调用大模型和插件,就可以轻松地实现一个功能强大的AI应用,开发起来非常轻松。
当年Visual Basic改变了桌面应用开发,扣子也会改变AI时代的应用开发,因为它极大地降低了AI应用开发的门槛,人人都可以开发AI应用,现在限制你的只有你的想象力了,一人公司从此真正可行了。
如果你想了解更多扣子平台相关的信息,强烈建议关注一下12月19日在上海举办的扣子开发者日。
开发者日的活动非常精彩,可以和扣子核心团队面对面交流,抢先了解扣子平台最新的功能,火热的最新模板,内测抢破头的语音API。还可以看到资深扣子开发者实战案例分享,和与会者碰撞一下,也许能碰出非常棒的创意,从而成功变现呢!如果有什么不满,还能大胆开麦,直接吐槽。
欢迎大家了解详情,立刻扫描下方二维码,预约直播吧!
热门跟贴