To B软件的底层功能逻辑已经变了!

  想象一下,如果和电脑或手机聊天就像和朋友聊天一样自然,会是啥样子?这不是科幻小说的情节,而是我们正在迈向的未来。随着大语言模型技术的突破,我们现在可以用平常的话语来和机器交流了。过去,我们习惯了点击图标、菜单,通过图形界面(GUI)来告诉电脑我们想要什么。但这种方式有时会让人感到有点生硬,尤其是当我们试图处理复杂的任务时。

  另一方面,科技大佬们都在说全部的产品都值得用大模型重新做一遍,那具体该如何重新做呢?这篇文章就是要聊聊这个话题。

  在探讨人机交互的未来之前,先让我们回顾一下现在——特别是基于图形用户界面(GUI)的软件功能和交互逻辑。这些界面,几十年来一直是我们与电子设备互动的主要方式,无论是在办公的地方还是在家里。

  GUI 的设计核心是基于视觉的交互逻辑,想一想你电脑上的桌面,或者电子设备屏幕上的应用图标。这些视觉元素,像图标、按钮和菜单,是GUI的基础,它们遵循“所见即所得”的原则,让用户通过看到的图形来理解软件的功能。这种设计使得用户能快速学习和使用新软件,因为它们提供了直观的视觉指引。

  然而,这种高度依赖视觉的界面对视觉障碍用户来说可能是个挑战。同时,GUI也需要较大的屏幕空间来有效展示,这在屏幕空间存在限制的设备上可能是个问题。

  而且,GUI通常是任务导向的。它们通过模态窗口和对话框,来引导用户完成特定操作序列。这在某种程度上预示着用户通常被引导去执行特定的任务,步骤明确,界面清晰。然而,这也带来了局限性。模态交互可能打断用户的工作流程,特别是当需要频繁在不同窗口或应用间切换时。这种方式在提高用户任务专注性的同时,可能限制了灵活性和流畅性。这就像是有人在指挥你“按我说的做”,有点儿限制你的自由。

  GUI的另一个核心元素是直接操控和即时反馈,用户通过拖拽、点击等动作直接与界面元素互动。这种互动方式为用户更好的提供了直观的反馈,增强了操作的感知。但是,直接操控也代表着用户要有一定的精细动作控制能力,这对运动能力受限的用户来说可能是个挑战。此外,对于处理复杂或抽象任务,例如大数据集的管理或高级编程,这种交互方式可能不是最有效的。

  总的来说,GUI确实挺实用,但也有它的局限。现在,随技术的发展,大家开始想,有没有更灵活、更适应个人需求的交互方式呢?

  让我们换个角度看看事情,想象一下,如果你只需要跟电脑或手机说话,它就能懂你的意思,多酷啊!这就是大模型给我们大家带来的魔法——通过自然语言的人机交互。

  这些模型的厉害之处在于,它们不仅仅懂得字面上的意思,还能懂得那些言外之意,比如双关语、俚语,甚至是那些说话含糊的地方,这在以前的技术里是想都不敢想的。

  而且,这些大模型超级擅长理解上下文。意思就是,它们不仅听得懂你现在说的话,还记得你之前说过的话。这就像是跟一个懂你的老朋友聊天一样,你不用每次都解释一大堆背景。

  这些模型可以跟你来回聊上好几轮,不像以前那样你问一句,它答一句。它们能够跟上你的思路,跟你聊得更自然,更像真人一样。

  正是这样一个技术突破,让机器变得更懂人,让我们跟机器的交流变得更像是跟人聊天。想想看,在不久之后,我们跟电脑、手机聊天可能就像跟朋友闲聊一样自在,这会带来多么大的改变?

  我们正见证着产品功能逻辑的一场根本变革,特别是当我们把自然语言界面(NLI)与传统的图形用户界面(GUI)作比较时。这种变化不仅仅是一个简单的技术更新,它其实就是重新定义了我们如何与软件产品做交互和沟通。具体来看:

  让我们谈谈用户界面(UI)设计的转变,传统的GUI依赖于视觉元素,比如按钮和图标,来指导用户。但是,在NLI的世界里,这些元素的重要性正在减少,取而代之的是对话框、语音输入和反馈机制。

  想象一下,你能够最终靠简单地说话来浏览网页,或者用语音命令来控制你的应用程序。这种以语言为中心的界面不仅让交互变得更自然,还大大简化了界面设计,使之变得更清晰和简洁。

  在NLI的世界里,UX设计师需要更多地考虑怎么让语言交互流畅和直观。这在某种程度上预示着设计师需要思考怎么样通过自然语言,来有效地引导用户达成目标,而不是依靠传统的点击和滚动操作。例如,一个智能助手应用可能需要能够理解和响应用户的自然语言查询,而不是让用户通过一系列的菜单选择来找到他们要的信息。

  此外,随着NLI的发展,我们还看到用户界面变得更个性化。系统能根据用户的语言习惯、喜好和过去的交互历史来定制响应和选项,这不仅提高了使用者真实的体验的质量,还非常大程度上减轻了用户的认知负担,因为他们不再需要记住复杂的操作步骤或导航结构。

  3、人机交互可以是动态的、非线性的、随性的,让系统来适应人,而不是让人去适应系统的逻辑。

  在GUI系统中,用户的交互通常是预设和有限的,你得按照特定的路径和方式去点击、滑动或输入。但在NLI的世界里,一切变得不同了。

  NLI带来的最大变革就是它的动态性和非线性,你不再被限制在菜单和按钮的框架内。想问什么就问什么,指令也可以是随机和自发的,系统都能灵活应对。这就像是打破了原本的规则,让交互变得更自由、更符合人类的自然沟通习惯。

  更重要的是,NLI能实时调整响应。这不仅仅是对问题的直接回答,而是一种可以依据对话内容和客户的真实需求的变化做调整的能力。比如,你在电子商务平台购物时可能会随意地问:“这件衣服有其他颜色吗?”然后又问:“有没有相似的款式推荐?”NLI系统能够理解这种连贯的对话,给出合适的建议,而不是简单地返回到起点或者要求用户重新导航。

  这种灵活性和适应性是GUI很难来做比较的,在GUI中,用户要适应软件的操作方式;而在NLI中,软件适应用户的交流方式。这就大幅度的提升了交互的自然性和效率,同时也降低了用户的学习曲线。

  那么,基于NLI的产品可能会“长”成什么样呢?又是怎么跟用户进行交互的呢?接下来,我们分别来看两个例子:C端电商产品,和B端BI数据分析产品。

  想象一下,你打开了一个基于NLI的电子商务平台。界面简洁,中央有一个像聊天窗口的区域,邀请你开始对话。你可以直接输入或说出:“我在找一双舒适的跑鞋。”

  系统立即响应:“您喜欢哪个品牌?有特定的预算吗?”你回答:“预算大概100美元左右,品牌不限。”系统迅速展示了一系列选项,并问:“您是为了训练还是比赛?要专业跑步鞋吗?”这个对话就像是与了解你的朋友聊天一样自然。

  你说:“是为了周末的马拉松训练。”系统随即提供了适合马拉松训练的鞋子,并附带用户评价和详细的产品信息。同时,它还建议:“根据您的需求,这款拥有非常良好缓震效果的跑鞋可能适合您。您还需要配套的运动装备吗?”

  你感兴趣地回复:“展示一些。”接着,系统展示了与你选择的鞋子风格和功能相匹配的运动服和配件。在整个购物过程中,系统不仅回应了你的具体需求,还主动提供了相关建议,使得购物体验既个性化又高效。

  在这个基于NLI的电子商务平台上,你不再需要穿越复杂的分类或过滤器,一切所需信息都通过对话获得,就像有一个虚拟的购物助手在帮助你做出最好的选择。

  想象一下,你正在使用一个基于NLI的BI数据分析平台。这样的平台的界面很简洁,主要是一个对话框,你可以在这里用自然语言提出数据查询和分析的请求。

  你登录进系统,开始提问:“展示上个季度全部的产品的销售数据。”系统迅速理解你的请求,并展示了一个详细的销售报告,包括各产品的销量、收入和增长趋势。

  然后,你可能想进一步探索特定产品的表现,于是你继续输入:“对比一下产品A和产品B在不一样的区域的销售表现。”系统不仅展示了这两个产品在不一样的地区的销售数据,还智能地生成了一个直观的对比图表,帮助你更清楚地看到区域市场的差异。

  为了进一步的分析,你问:“哪一些原因影响了产品A的销售?”这时,系统通过其高级数据分析功能,提出了几个可能的因素,如市场趋势、促销活动的效果和竞争对手的表现,并提供了有关数据的深入分析。

  在这个基于NLI的BI平台上,你不需要精通复杂的查询语言或手动操作数据。你只需提出问题,系统就能理解你的意图并提供对应的数据和分析。这使得数据分析变得更直观和快捷,即使是非技术背景的用户也能轻松进行复杂的数据分析。

  虽然这些大模型挺聪明的,能懂我们说的话,但有时候它们还是会弄错。比如,当我们说些复杂或者有点含糊的话时,这些系统可能就不太能跟上了。而且,这些模型虽然能记住我们聊过的内容,但如果聊得太久,它们可能就会有点跟不上节奏,忘了之前聊过什么。

  而且,如果要让这个系统服务全世界的用户,它还得能懂各种各样的语言和方言,这可不是件容易的事。

  还有一个头疼的问题是隐私,为了让这些系统更懂我们,它们需要收集很多我们的信息。这就让人担心,我们的私人信息会不会被泄露出去。

  另外,大家都习惯了用传统的点击和滑动的方式和电子设备交流。突然让大家改用语言来操作,这需要一段时间去适应。

  响应的精准度和流程化也是一个大挑战,用户可能会出现各种各样的需求,有些是直接和明确的,有些则是模糊和多层次的。系统要能够从这些需求中提炼出关键信息,并给出恰当的回应。这不仅需要系统可处理复杂的查询逻辑,还要能在必要时引导用户更好的提供更多信息,以便形成更加完整和精确的响应。

  当然,开发和维护这种高大上的NLI系统可不便宜,对很多公司来说,这可能是个大投资。用某些科技大佬的话说,要用大模型来将所有业务重做一遍,那意味这原有产品体系的大规模改造,这是一个系统工程。不仅投入巨大,失败的风险也很大。就像当初从PC互联网转向移动网络,大家都知道这是一个大趋势,但真正拿到移动互联网船票的人毕竟是少数。

  而且,基于人机对话的产品具体应该是怎样,我们完全不知道。在这样的一个过程中,肯定会产生很多让人啼笑皆非的“试验品”。还记得2018年罗永浩发布的那个“TNT工作站”么?号称是要颠覆人们的办公方式,通过语言来让电脑办公,结果嗓子都吼哑了,也没能完成几项工作。当然,罗永浩当年发布“TNT工作站”的时候,大模型技术还没成型,人机之间的语言交流还远不如现在流畅。所以,这是时代的局限,不怪罗永浩。

  总之,虽然用这种自然语言交互的方式听起来挺酷的,也能让我们的生活更方便,但要实际做到这一点,还有不少问题是需要解决。返回搜狐,查看更加多