栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 软件开发 > 后端开发 > Python

中文大写转阿拉伯数字(金额)

Python 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

中文大写转阿拉伯数字(金额)


输入:金额的中文大写(字符串)
输出:阿拉伯数字(float或int型)


    整数部分主要是利用正则表达式进行检索,将对应项的数字与单位列表的对应项相乘并求和,小数部分也是一样的手法,但是由于可能存在只有角的情况,正则表达式不好处理,而且角、分这里涉及的情况并不多,所以我们分离处理

1. 初始化参数
    def __init__(self, word):
 """
 :param word: 用户传入的中文字符串
 初始化参数,包括:
 {
     is_int :int/float    是否为纯整数
     word:str    用作转换的中文金额
     int_part:str    整数部分字符串
     dec_part:str    小数部分字符串
     int_level:list    整数部分的单位列表
     trans_tab:dict    映射表
     pattern:_sre.SRE_Pattern    正则表达式compile规则
 }
 """
 if word.endswith('圆'):
     self.int_part = word
     self.is_int = True
 elif word.endswith('角') or word.endswith('分'):
     self.int_part = word[:word.index('圆') + 1]
     self.dec_part = word[word.index('圆') + 1:]
     self.is_int = False
 self.word = word
 self.int_level = [1, 10, 100, 1000, 10000, 100000, 1000000, 10000000, 100000000, 1000000000, 10000000000,
      100000000000, 1000000000000]
 self.trans_tab = str.maketrans('零壹贰叁肆伍陆柒捌玖', '0123456789')
 self.pattern = re.compile('(?:(.*?)兆)?(?:(.*?)千)?(?:(.*?)百)?(?:(.*?)拾)?(?:(.*?)亿)?(?:(.*?)千)?(?:(.*?)佰)'
      '?(?:(.*?)拾)?(?:(.*?)万)?(?:(.*?)仟)?(?:(.*?)佰)?(?:(.*?)拾)?(.*?)圆')
2. 处理整数部分

I. 用正则表达式按照模板检索(从兆位到个位,没有对应项则为空)
II. 按照映射表执行映射后组合成数字列表
III. 将数字列表与数字单位列表的对应索引项进行相乘后求和

# 用正则表达式按照模板检索(从兆位到个位,没有对应项则为空)
word_list = re.findall(self.pattern, self.int_part)[0]
# 按照映射表执行映射后组合成数字列表
number_list = list(reversed(list(map(self.word_format, word_list))))
# 将数字列表与数字单位列表的对应索引项进行相乘后求和
print(sum(
    [int(number_list[i]) * self.int_level[i] for i in range(len(number_list))]
))
3. 处理小数部分

I. 长度为4:N角N分,获取到角和分对应的数字,映射后与单位相乘求和

if len(self.dec_part) == 4:
    dec_word_list = list(self.dec_part[0] + self.dec_part[2])
    dec_number_list = list(map(self.word_format, dec_word_list))
    dec_number = int(dec_number_list[0]) * 0.1 + int(dec_number_list[1]) * 0.01

II. 长度为3:零N分,获取到分对应的数字,执行映射后与单位相乘

elif len(self.dec_part) == 3:
    dec_number = int(self.word_format(self.dec_part[:-1])) * 0.01

III. 长度为2,N角,获取到角对应的数字,执行映射后与单位相乘

else:
    dec_number = int(self.word_format(self.dec_part[:-1])) * 0.1
4. 数据映射

    和之前提到的映射方法一致,只是将数字与汉字对调,这里有一个对字符串的处理,如果是零N的形式则将字符串替换为N,如果是空字符串,则按照零执行映射

def word_format(self, word):
 """
 
 :param word: 对传入的word字符串进行映射处理
 :return: 根据传入字符串的长度进行处理后执行映射
 """
 if len(word) > 1:
     return word[-1].translate(self.trans_tab)
 elif len(word) == 0:
     return '零'.translate(self.trans_tab)
 return word.translate(self.trans_tab)
5. 数据检查

判断数据合理性

def data_check(self):
    """
    数据检查,是否符合输入要求
    :return: 传入的数据不是字符串类型或者长度越界则返回False,否则返回True
    """
    if not isinstance(self.word, str):
 return False
    if self.is_int:
 if len(self.int_part) > 26:
     return False
 else:
     return True
    else:
 if len(self.int_part) > 26 or len(self.dec_part) > 4:
     return False
 else:
     return True

  • 代码详见Github
转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/219642.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号