2010后宝宝取名用字-大数据下的取名字用字统计分析
转自网帖
大学同学要给孩子起名字,运用工作中标准做的统计分析,十分有趣。经愿意后共享给大伙儿。
算下時间不早了,该给我家**取名字了,因此今日下午运用大数据的优点,干了个无趣的统计分析。
我提取了2010年1月1日之后出世的三十万小孩子的名字。
最先,居然发觉性别比例为18:13,显而易见将来男宝宝谈对象该有多么的艰难。在其中,名字为两字的小朋友有2.五万人,三个字的小朋友有28.一万人,四个字的小朋友有2000多的人。四个字的小朋友绝大多数全是父姓+母姓+两字的姓名。应当说,三个字的小朋友占了绝大部分,竟做到了91%。
四个字的小朋友即使了,我对两字和三个字的小朋友依照男孩和女孩性別不一样又干了一次区划,统计分析数据显示:
1、两字名的男宝宝第二个字发生頻率最大的前五名各自为“睿”(2.59%)、“浩”(2.56%)、“博”(1.82%)、“瑞”(1.80%)、“昊”(1.78%),换句话说,男宝宝叫hao或是叫rui的占了非常大占比。
2、两字名的女宝宝第二个字发生頻率最大的前五名分别是“悦”(2.94%)、“妍”(2.45%)、“涵”(2.07%)、“玥”(1.53%)、“蕊”(1.42%),换句话说,女宝宝叫yue的占据非常大的占比。
3、三字名的男宝宝第二个字发生頻率最大的前五名分别是“子”(5.93%)、“梓”(3.41%)、“浩”(3.32%)、“宇”(3.07%)、“俊”(2.50%),这一避而远之了,居然有贴近十分之一的三字名男宝宝叫什么名字zi哪些。
4、三字名的男宝宝第三个字发生頻率最大的前五名分别是“轩”(6.04%)、“宇”(5.16%)、“泽”(2.84%)、“杰”(2.49%)、“豪”(2.19%),这一算也吓了一跳,居然超出十分之一的三字名男宝宝叫啥啥啥轩或是啥啥啥宇。
接着,我又用颤抖的手统计分析了一下三字名女宝宝的姓名,結果也是令我觉得吃惊:
5、三字名的女宝宝第二个字发生頻率最大的前五名分别是“雨”(5.11%)、“梓”(3.69%)、“欣”(3.61%)、“子”(3.58%)、“思”(3.52%),换句话说,三字名女宝宝的正中间字是这五个字的占比居然达到五分之一!
6、三字名的女宝宝第三个字发生頻率最大的前五名分别是“涵”(6.75%)、“萱”(3.63%)、“怡”(3.18%)、“彤”(2.66%)、“琪”(2.65%),一样的,这前五名也占了三字名女宝宝的近五分之一总数!在其中,叫“涵”的女宝宝占比居然达到6.75%,简直令人吃惊。
原本到这儿早已统计分析告一段落,之后发觉也有一种更为超级变态的统计分析,当我们按住运作按键,出去結果以后,我完全的震惊:
7、三字名男宝宝的姓名前六名分别是“皓宇”(0.90%)、“子妍”(0.73%)、“皓然”(0.59%)、“雨泽”(0.55%)、“宇轩”(0.55%)、“子涵”(0.51%)。
8、三字名女宝宝的姓名前六名分别是“雅萱”(0.79%)、“子涵”(0.69%)、“欣妍”(0.59%)、“雨涵”(0.51%)、“可馨”(0.46%)、“诗涵”(0.45%)。
那样计算下来,我真的是吓了一大跳,叫“子涵”或“欣妍”的小朋友,居然占比这般之高!那麼,大家家小孩的名字是否在之上队伍呢?
并且,通俗化的姓名很显著地区有时期的气场,与我们这一代的通俗化姓名多是“峰”、“鹏”、“艳”这些,这在10后小朋友姓名总排名在了30名之后的部位。而10后小朋友的大家名“轩”、“涵”、“浩”这些则更好像古装剧或游戏里面的人物名字。难道说10后的小朋友真的是爸爸妈妈刷级杀怪掉出去的么?
此次统计分析造成了我的思索,连宝宝的名字都是会伴随着时期的发展趋势而转变,而实际上也许大部分爸爸妈妈并未曾想起要给孩子起一个通俗化的姓名,绕开了当初通俗化的“峰”、“鹏”、“艳”、“丽”,但刚好是那样的构思,却导致了一个新的时期的通俗化时尚潮流。
参照:
美名腾取名常用字统计分析