- 巧用ChatGPT进行数据分析与挖掘
- 谢佳标
- 1400字
- 2024-11-28 18:50:21
1.2.1 如何使用OpenAI的GPT-3.5
1.通过ChatGPT聊天界面
OpenAI公司开发的GPT-3.5和GPT-4都能够处理文本,让计算机能像人类一样理解和生成语言。GPT-3.5和GPT-4有一些显著的区别。GPT-4比GPT-3.5更大,可训练的数据更多,在处理复杂问题时表现更好。具体来说,GPT-4具备更好的零样本学习能力,这意味着它能够在没有示例的情况下学习新任务;它也可以通过迁移学习和微调来适应特定任务,比如情感分析、文本摘要和机器翻译等;GPT-4还擅长纠正输入中的错误,能够生成更自然流畅的文本。
读者可自行在OpenAI官网(https://openai.com/)右上角单击“Try ChatGPT”按钮进入ChatGPT官网(https://chat.openai.com/)申请注册ChatGPT账号,本书不再详细介绍申请账号的过程。
用注册好的账号登录ChatGPT官网后,即可进入ChatGPT的聊天界面,如图1-1所示。
图1-1 ChatGPT的聊天界面
由图1-1可知,我们现在使用的是免费的GPT-3.5模型,读者也可以将账号升级至ChatGPT Plus,以体验更强大的GPT-4模型。不过笔者认为GPT-3.5模型已经足以帮助读者学习Python数据分析的相关理论和工具了,可暂时不进行账号升级。
在聊天界面正下方的输入框中输入文字并单击发送,即可与ChatGPT进行互动。例如,输入“作为数据分析专家,请用通俗易懂的语言给小白介绍什么是线性回归。”后,得到的答案如下所示。
线性回归是一种统计方法,用于理解和预测两个或多个变量之间的关系。它特别适用于了解一个变量如何受其他变量的影响。可以将其想象成一条直线,以帮助我们理解数据点之间的趋势。例如,如果你想知道学习时间与考试成绩之间的关系,线性回归可以帮助你找到这两者之间是否存在相关性,以及这种相关性的强度和方向。这个方法有助于进行预测或制定决策,尤其是当你需要根据已知数据来推断未知情况时。
2.通过Cursor工具
由于国内注册ChatGPT官网账号的难度较大,一般无法直接打开ChatGPT的聊天界面进行互动,所以接下来推荐一款基于GPT的代码生成工具Cursor。Cursor利用GPT技术,将开发者输入的自然语言描述转化为代码,从而实现代码的快速生成,提高开发效率。Cursor是一款智能开发者编程工具,底层是由GPT-3.5或者GPT-4支持的,国内可以直接使用。Cursor支持Windows、Linux、macOS等系统,免费版可以享受每月50次GPT-4互动和200次GPT-3.5互动,Cursor客户端还支持用户调用自己的OpenAI Key。
读者可直接在Cursor官网(https://cursor.sh/)下载Cursor软件进行安装,如图1-2所示。
图1-2 Cursor官网
在Cursor官网可以用国内邮箱注册账号。完成注册并成功登录后即可获得相应的免费使用次数,当然如有需要也可升级到Pro,如图1-3所示。
图1-3 Cursor账号的免费使用次数
Cursor软件安装完成后可双击打开,单击右上角的按钮可打开“CURSOR SETTINGS”界面,如图1-4所示。
图1-4 打开“CURSOR SETTINGS”界面
单击图1-4中的“Sign in”按钮登录Cursor,登录后可在“Model”模块切换GPT-3.5或GPT-4,如图1-5所示。
至此,我们就可以利用Cursor与GPT-3.5或GPT-4互动了。常用的是两个快捷键:Ctrl+K和Ctrl+L。
❍ Ctrl+K:把输出数据直接写入文件中。
❍ Ctrl+L:把输出数据展示到右侧面板中(输出的数据不会直接输出到文件中),类似于智能问答系统,根据上下文有问有答。
现在,我们来创建一个新文件,通过一个例子来体验Cursor如何帮我们写代码。按Ctrl+K快捷键,在调出的输入窗口中输入文本“作为数据分析专家,请用scikit-learn库自带的iris数据集进行k近邻分类,实现对花种类的预测,要求基于scikit-learn库的KNeighborsClassifier类实现,并评估模型预测效果。”,如图1-6所示。
图1-5 登录Cursor后可切换不同的GPT版本
图1-6 用Ctrl+K快捷键调出窗口输入问题
输入问题后,单击图1-6中的“Generate”按钮,Cursor即可根据问题输出答案,如下所示。
如果读者觉得ChatGPT注册困难且聊天界面无法访问,又不习惯Cursor的交互方式,那还能否继续利用ChatGPT辅助Python数据分析的学习呢?答案当然是可以。接下来继续介绍两款国内非常好用的工具。