在哪里找大于100MB的数据集?
时间: 2024-06-08 19:07:44 浏览: 145
你可以在以下网站上找到大于100MB的数据集:
1. Kaggle:https://www.kaggle.com/datasets
2. UCI机器学习库:https://archive.ics.uci.edu/ml/index.php
3. Google BigQuery Public Datasets:https://cloud.google.com/bigquery/public-data
4. AWS公共数据集:https://aws.amazon.com/public-datasets/
5. 数据集搜索引擎:https://datasetsearch.research.google.com/
请注意,使用大型数据集可能需要更多的计算资源和存储空间。
相关问题
金仓如何设置编码集 utf8mb4
UTF8MB4是一种MySQL编码集,它支持4个字节的Unicode字符。要将MySQL数据库的默认编码集设置为UTF8MB4,可以按照以下步骤操作:
1. 确认当前的MySQL版本是否支持UTF8MB4编码集。可以登录MySQL并运行以下命令查看:
```sql
SHOW VARIABLES LIKE '%version%';
```
如果版本号大于等于5.5.3,则支持UTF8MB4。
2. 在MySQL配置文件(my.cnf或my.ini)中设置默认编码集为UTF8MB4。可以在[mysqld]标签下添加以下行:
```ini
[mysqld]
character-set-server = utf8mb4
collation-server = utf8mb4_unicode_ci
```
注意:如果您已经创建了数据库,请确保在更改配置文件之前将其备份,以免数据丢失。
3. 重启MySQL服务以应用更改。
```bash
sudo service mysql restart
```
4. 现在,您可以在新创建的数据库和表中使用UTF8MB4编码集。例如,可以使用以下命令创建具有UTF8MB4编码集的新数据库:
```sql
CREATE DATABASE mydatabase CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci;
```
在创建表时,也可以指定使用UTF8MB4编码集:
```sql
CREATE TABLE mytable (
id INT(11) NOT NULL AUTO_INCREMENT,
name VARCHAR(255) CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci,
PRIMARY KEY (id)
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_unicode_ci;
```
注意:如果您已经创建了数据库和表,请确保在更改编码集之前备份数据,以免数据丢失。
(1)使用PyMySQL库建立与MySQL的连接,并返回一个db对象。 (2)使用SQL语句创建一个名为course的表,并设置id(编号),coursename(课程名称),teacher(任课教师),coursetype(课程类别),term(开课学期)的字段和属性,并将id设为主键,字符集使用utf8mb4 (3)使用游标cursor执行SQL语句,在数据库管理工具手动添加至少5条数据。 (4)通过PyMySQL向表course查询字段term值大于2的记录,并使用for循环输出所有记录。如果出现异常,则抛出异常信息。
以下是代码实现:
```python
import pymysql
# 建立与MySQL的连接
db = pymysql.connect(host='localhost', user='root', password='password', database='test_db', charset='utf8mb4')
# 使用游标执行SQL语句,创建名为course的表
cursor = db.cursor()
sql_create_table = '''CREATE TABLE course (
id INT PRIMARY KEY NOT NULL,
coursename VARCHAR(50) NOT NULL,
teacher VARCHAR(20) NOT NULL,
coursetype VARCHAR(20),
term INT(2) NOT NULL
)charset=utf8mb4;'''
cursor.execute(sql_create_table)
# 添加至少5条数据
sql_insert_data = '''INSERT INTO course (id, coursename, teacher, coursetype, term)
VALUES (1, '数学分析', '张三', '必修', 3),
(2, '线性代数', '李四', '必修', 2),
(3, '计算机组成原理', '王五', '必修', 1),
(4, '计算机网络', '赵六', '选修', 2),
(5, '数据结构', '钱七', '选修', 3);'''
cursor.execute(sql_insert_data)
# 查询字段term值大于2的记录,并输出所有记录
try:
sql_query_data = "SELECT * FROM course WHERE term > 2;"
cursor.execute(sql_query_data)
results = cursor.fetchall()
for row in results:
print("id=%d, coursename=%s, teacher=%s, coursetype=%s, term=%d" % (row[0], row[1], row[2], row[3], row[4]))
except Exception as e:
print(e)
# 关闭游标和数据库连接
cursor.close()
db.close()
```
请注意修改代码中的数据库连接参数,确保可以连接到正确的数据库。
阅读全文