Python元组和集合
本节将介绍Python中的两种重要数据类型:元组(tuple)和集合(set)。它们各自有着独特的特性和应用场景。
元组(Tuple)
元组是不可变的序列类型,一旦创建就不能修改。这种特性使它特别适合存储不应该被改变的数据。
创建元组
# 创建空元组
empty_tuple = ()
empty_tuple2 = tuple()
# 创建包含元素的元组
coordinates = (10, 20)
point3d = (1, 2, 3)
# 创建单元素元组(注意逗号)
single_item = (1,) # 正确
not_tuple = (1) # 错误:这是一个整数
# 不使用括号创建元组
coordinates = 10, 20
point3d = 1, 2, 3
访问元组元素
coordinates = (10, 20, 30)
# 使用索引
print(coordinates[0]) # 输出: 10
print(coordinates[-1]) # 输出: 30
# 切片
print(coordinates[1:]) # 输出: (20, 30)
print(coordinates[:2]) # 输出: (10, 20)
元组解包
# 基本解包
x, y, z = (1, 2, 3)
print(x, y, z) # 输出: 1 2 3
# 使用*收集多余的值
first, *rest = (1, 2, 3, 4, 5)
print(first) # 输出: 1
print(rest) # 输出: [2, 3, 4, 5]
# 交换变量
a, b = 10, 20
a, b = b, a # 使用元组解包交换值
元组的方法
numbers = (1, 2, 2, 3, 4, 2)
# 计数
print(numbers.count(2)) # 输出: 3
# 查找索引
print(numbers.index(3)) # 输出: 3
集合(Set)
集合是无序的、不重复元素的集合。它支持数学中的集合操作,如并集、交集等。
创建集合
# 创建空集合
empty_set = set() # 注意:{}创建的是空字典
# 从列表创建集合
numbers = set([1, 2, 3, 2, 1]) # 重复元素会被自动去除
print(numbers) # 输出: {1, 2, 3}
# 使用花括号创建
fruits = {"apple", "banana", "orange"}
集合操作
# 添加和删除元素
fruits = {"apple", "banana"}
# 添加元素
fruits.add("orange")
# 删除元素
fruits.remove("banana") # 元素不存在会报错
fruits.discard("mango") # 元素不存在不会报错
# 随机移除并返回元素
item = fruits.pop()
# 清空集合
fruits.clear()
集合运算
set1 = {1, 2, 3, 4}
set2 = {3, 4, 5, 6}
# 并集
print(set1 | set2) # 使用运算符
print(set1.union(set2)) # 使用方法
# 交集
print(set1 & set2) # 使用运算符
print(set1.intersection(set2)) # 使用方法
# 差集
print(set1 - set2) # 使用运算符
print(set1.difference(set2)) # 使用方法
# 对称差集(并集减去交集)
print(set1 ^ set2) # 使用运算符
print(set1.symmetric_difference(set2)) # 使用方法
集合关系运算
set1 = {1, 2, 3}
set2 = {1, 2, 3, 4}
set3 = {5, 6, 7}
# 子集检查
print(set1 <= set2) # True:set1是set2的子集
print(set1.issubset(set2))
# 超集检查
print(set2 >= set1) # True:set2是set1的超集
print(set2.issuperset(set1))
# 不相交检查
print(set1.isdisjoint(set3)) # True:set1和set3没有共同元素
实际应用场景
使用元组的场景
# 函数返回多个值
def get_coordinates():
return (10, 20)
x, y = get_coordinates()
# 字典键
locations = {
(0, 0): "原点",
(1, 0): "右侧",
(0, 1): "上方"
}
# 数据不可变性保证
constants = (3.14, 2.718, 1.414)
使用集合的场景
# 去重
numbers = [1, 2, 2, 3, 3, 4, 4, 5]
unique_numbers = list(set(numbers))
# 成员检查(比列表更快)
valid_users = {"alice", "bob", "charlie"}
user = "alice"
if user in valid_users:
print("用户存在")
# 数据去重并保持顺序(Python 3.7+)
from dict.fromkeys import fromkeys
numbers = [1, 2, 2, 3, 3, 4, 4, 5]
unique_ordered = list(dict.fromkeys(numbers))
最佳实践
元组使用建议:
- 用于表示固定数量的相关值
- 作为字典的键(列表不能作为键)
- 返回多个值的函数结果
集合使用建议:
- 需要去重时优先使用集合
- 需要频繁成员检查时使用集合
- 需要执行集合运算时使用
性能考虑:
- 集合的成员检查比列表快
- 元组比列表占用更少的内存
下一步
现在您已经掌握了Python中的元组和集合,接下来我们将学习如何在实际的LLM API数据处理中应用这些数据类型。