如何使用 Google Gemma 大模型将自然语言转为 SQL？（一）

使用 Google 的 Gemma 模型对 SQL 数据库进行自然语言查询。在本指南您将了解如何利用 Google Gemma 模型的强大功能，使用自然语言查询 SQL 数据库。本教程将逐步引导您设置一个功能强大、直观且用户友好的 SQL 查询系统。

在正式微调训练之前，需要先完成下面的工作。

https://huggingface.co/datasets/b-mc2/sql-create-context 本数据集其中包含 78,577 个自然语言查询、SQL CREATE TABLE 语句和使用 CREATE 语句作为上下文回答问题的 SQL 查询示例。

借助 Colaboratory(简称 Colab)，您可在浏览器中编写和执行 Python 代码，并且：

并且要在Google Colab的秘钥管理位置添加秘钥，名称为HF_TOKEN，以供代码访问Huggingface使用。

2024年2月21日，Google发布了最新的开放模型Gemma。是其为推动AI创新的开发者和研究者社区而构建的。Gemma 模型与Gemini共享技术和基础设施组件。并且其设计以 Google人工智能原则为核心。

Google Gemma 的两个版本：

基于Google Colab 的T4机型的硬件配置，本次模型训练使用Gemma-2B模型。

在Huggingface上使用该模型，需进入Huggingface 找到Gemma-2B模型，同意相关协议和完成授权。完成以上操作以后会得到下图的提示信息。