Comparez SQL pour apprendre Python : exécutez SQL dans le bloc-notes jupyter

Jupyter notebook est l'outil de choix pour exécuter python, peut-il donc être utilisé pour exécuter SQL ? Il peut être facilement implémenté en appelant sqlite3 avec deux lignes de code :

Changeling

import pandas as pd
import sqlite3

Importer des données

# 读取数据集并将其保存在内存中
data = pd.read_csv('/kaggle/input/store-order-volume/store order volume.csv')
# 修改字段名
data.columns = ['uid','AB_group','show_count','click_count','order_count','order_shops','shop_type','date']
data.head()

 Code détaillé :

data est la variable que nous utilisons pour stocker l'ensemble de données, qui est au format dataframe ;

data.columns renvoie l'index de la colonne, nous pouvons l'utiliser pour modifier le nom du champ, notez que le nom du champ doit être cohérent avec l'ensemble de données. (Étant donné que les noms de champ de l'ensemble de données d'origine sont en chinois, ils doivent être modifiés en anglais pour répondre aux habitudes d'utilisation de la base de données)


Appelez l'outil sqlite3

# 创建内存数据库:使用sqlite3库创建一个内存数据库
conn = sqlite3.connect(':memory:')
# 将数据导入数据库:将加载的数据集导入到内存数据库中
data.to_sql('store_order', conn, index=False)

Code détaillé :

La fonction de ce code est de créer une base de données mémoire SQLite vide et d'établir un objet de connexion pour les opérations ultérieures.

SQLite est un système léger de gestion de bases de données relationnelles qui peut créer des bases de données dans des fichiers locaux ou en mémoire.

":memory:" est une chaîne spéciale utilisée dans SQLite pour représenter la base de données mémoire, ce qui signifie créer une base de données mémoire vide.

La fonction to_sql() est une fonction utilisée dans pandas pour écrire des données de trame de données dans une base de données SQL. Il accepte trois paramètres obligatoires : le nom de la table, la connexion à la base de données et le mode d'écriture.


Renseigner

Enfin, vous pouvez interroger en affectant la valeur SQL dans la requête :

query = "SELECT shop_type,count(Distinct uid) users FROM store_order group by shop_type"
result = pd.read_sql_query(query, conn)
result

résultat de l'opération :

Je suppose que tu aimes

Origine blog.csdn.net/Sukey666666/article/details/130695147
conseillé
Classement