一尘不染

根据使用频率随机生成字母?

algorithm

如何根据常用语音中字母的使用频率随机生成字母?

任何伪代码都值得赞赏,但是用Java实现是很棒的。否则,朝正确的方向戳一下将很有帮助。

注意:我不需要生成使用频率-我确信我可以很容易地查找它。


阅读 238

收藏
2020-07-28

共1个答案

一尘不染

我假设您将频率存储为0到1之间的浮点数,总计为1。

首先,您应该准备一个累积频率表,即该字母及其之前所有字母的频率之和。

为简化起见,如果从此频率分布开始:

A  0.1
B  0.3
C  0.4
D  0.2

您的累积频率表将为:

A  0.1
B  0.4 (= 0.1 + 0.3)
C  0.8 (= 0.1 + 0.3 + 0.4)
D  1.0 (= 0.1 + 0.3 + 0.4 + 0.2)

现在生成一个介于0和1之间的随机数,并查看该数字在此列表中的位置。选择累积频率最小的字母大于随机数的字母。一些例子:

假设您随机选择0.612。这介于0.4和0.8之间,即介于B和C之间,因此您选择C。

如果您的随机数为0.039,则该数字在0.1之前,即A之前,因此请选择A。

我希望这是有道理的,否则请随时进行澄清!

2020-07-28