python中字符串转元组时的小技巧

一、问题引入二、问题深入

1、第一次尝试2、第二次尝试3、第三次尝试三、总结

一、问题引入

最近在做问答系统项目时，发现一个很有意思的小问题。

目的：我把txt里的内容读取出来，以元组对形式保存在列表中统一格式，然后再保存到sqlite3里。

txt里问题和答案都数据str类型，读取出来很容易就直接上代码了。

txt格式（三个为例）：

LABEL:QUESTION:ANSWER
26:张三老师:电气学院的张三老师的研究方向是电气工程,今年预计招收3名学生
27:张三老师的研究方向:电气学院的张三老师的研究方向是电气工程
28:请问张三老师是做什么的:电气学院的张三老师的研究方向是电气工程

from itertools import islice

f = open('ceshi.txt','r',encoding = 'utf-8')
for line in islice(f,1,None):   # 跳过第一行数据
    label = line.split(':')[0]
    question = line.split(':')[1]
    answer = line.split(':')[2]

二、问题深入

上面我们拿到了question和answer数据，那么怎么把两个字符串组成元组呢？（即（question,answer）形式）

1、第一次尝试

第一反应就是使用tuple()

tuple(question+ ',' + answer)

一开始就单纯的想着直接tuple强制转化

然后输出结果是这样

图片版：

文字版：

(‘张’, ‘三’, ‘老’, ‘师’, ‘,’, ‘电’, ‘气’, ‘学’, ‘院’, ‘的’, ‘张’, ‘三’, ‘老’, ‘师’,‘的’, ‘研’, ‘究’, ‘方’, ‘向’, ‘是’, ‘电’, ‘气’, ‘工’, ‘程’, ‘,’, ‘今’, ‘年’, ‘预’,‘计’, ‘招’, ‘收’, ‘3’, ‘名’, ‘学’, ‘生’, ‘n’)

(‘张’, ‘三’, ‘老’, ‘师’, ‘的’, ‘研’, ‘究’, ‘方’, ‘向’, ‘,’, ‘电’, ‘气’, ‘学’, ‘院’, ‘的’, ‘张’, ‘三’, ‘老’, ‘师’, ‘的’, ‘研’, ‘究’, ‘方’, ‘向’, ‘是’, ‘电’, ‘气’, ‘工’, ‘程’, ‘n’)

(‘请’, ‘问’, ‘张’, ‘三’, ‘老’, ‘师’, ‘是’, ‘做’, ‘什’, ‘么’, ‘的’, ‘,’, ‘电’, ‘气’, ‘学’, ‘院’, ‘的’, ‘张’, ‘三’, ‘老’, ‘师’, ‘的’, ‘研’, ‘究’, ‘方’, ‘向’, ‘是’, ‘电’, ‘气’, ‘工’, ‘程’, ‘n’)

这和我想要得到（question,answer）格式，不一样。上网找解决方法。

2、第二次尝试

查了网上一些方法得出的结论是这样的

from itertools import islice

f = open('ceshi.txt','r',encoding = 'utf-8')
for line in islice(f,1,None):   # 跳过第一行数据
    label = line.split(':')[0]
    question = line.split(':')[1]
    question1 = []
    question1.append(question)
    answer = line.split(':')[2]
    answer1 = []
    answer1.append(answer)
    couple = tuple(question1)+tuple(answer1)

输出结果：

图片版：

文字版：

(‘请问张三老师是做什么的’, ‘电气学院的张三老师的研究方向是电气工程n’)
(‘张三老师招生人数’, ‘电气学院的张三老师今年预计招收3名学生n’)
(‘张三老师要几个人’, ‘电气学院的张三老师今年预计招收3名学生n’)

这样写确实达到了我们想要的目的，但是结尾处有n。还需要写行代码解决掉。这么看虽然问题解决了，但是代码效率不是特别高。

3、第三次尝试

这次和同学讨论，直接给出了以下比较讨巧的方法

from itertools import islice

f = open('ceshi.txt','r',encoding = 'utf-8')
for line in islice(f,1,None):   # 跳过第一行数据
    label = line.split(':')[0]
    question = line.split(':')[1]
    answer = line.split(':')[2]
    couple = (question,answer[:-1])

只需要加上最后一行就可以

输出结果：

图片版：

文字版：

(‘张三老师’, ‘电气学院的张三老师的研究方向是电气工程,今年预计招收3名学生’)
(‘张三老师的研究方向’, ‘电气学院的张三老师的研究方向是电气工程’)
(‘请问张三老师是做什么的’, ‘电气学院的张三老师的研究方向是电气工程’)
(‘张三老师招生人数’, ‘电气学院的张三老师今年预计招收3名学生’)
(‘张三老师要几个人’, ‘电气学院的张三老师今年预计招收3名学生’)

这样很好的达到我们想要元组对的目的。

三、总结

我和同学的讨论最后得出的结果。

第一种尝试，可能是tuple()把非元组类型（比如字符串）以最小的为单位，进行组合转换。所以就出现了字符串中每个字之间都有一个’,’

第二种尝试，代码执行效率太低

第三种尝试，把两个字符串直接以字符串对的形式，保存在元祖中。所以元组就会以对的形式，进行转换。

以上讨论均是我们的猜想。

如果有错误，麻烦各位直接指出来！

感谢！！！

python中字符串转元组时的小技巧

Python相关栏目本月热门文章