4198: [Noi2015]荷马史诗 (哈夫曼树基础)

一、题目概述

4198: [Noi2015]荷马史诗

Time Limit: 10 Sec  Memory Limit: 512 MB
Submit: 1545  Solved: 818
[Submit][Status][Discuss]

Description

追逐影子的人,自己就是影子。 ——荷马

Allison 最近迷上了文学。她喜欢在一个慵懒的午后,细细地品上一杯卡布奇诺,静静地阅读她爱不释手的《荷马史诗》。但是由《奥德赛》和《伊利亚特》组成的鸿篇巨制《荷马史诗》实在是太长了,Allison 想通过一种编码方式使得它变得短一些。
一部《荷马史诗》中有 n 种不同的单词,从 1 到 n 进行编号。其中第 i 种单词出现的总次数为 wi。Allison 想要用 k 进制串 si 来替换第 i 种单词,使得其满足如下要求:
对于任意的 1≤i,j≤n,i≠j,都有:si 不是 sj 的前缀。
现在 Allison 想要知道,如何选择 si,才能使替换以后得到的新的《荷马史诗》长度最小。在确保总长度最小的情况下,Allison 还想知道最长的 si 的最短长度是多少?
一个字符串被称为 k 进制字符串,当且仅当它的每个字符是 0 到 k−1 之间(包括 0 和 k−1)的整数。
字符串 Str1 被称为字符串 Str2 的前缀,当且仅当:存在 1≤t≤m,使得 Str1=Str2[1..t]。其中,m 是字符串 Str2 的长度,Str2[1..t] 表示 Str2 的前 t 个字符组成的字符串。
 

Input

输入文件的第 1 行包含 2 个正整数 n,k,中间用单个空格隔开,表示共有 n 种单词,需要使用 k 进制字符串进行替换。

接下来 n 行,第 i+1 行包含 1 个非负整数 wi,表示第 i 种单词的出现次数。
 

Output

输出文件包括 2 行。

第 1 行输出 1 个整数,为《荷马史诗》经过重新编码以后的最短长度。
第 2 行输出 1 个整数,为保证最短总长度的情况下,最长字符串 si 的最短长度。
 

Sample Input

4 2

1

1

2

2

Sample Output

12

2

HINT

用 X(k) 表示 X 是以 k 进制表示的字符串。

一种最优方案:令 00(2) 替换第 1 种单词,01(2) 替换第 2 种单词,10(2) 替换第 3 种单词,11(2) 替换第 4 种单词。在这种方案下,编码以后的最短长度为:

 

1×2+1×2+2×2+2×2=12

最长字符串 si 的长度为 2。
 

一种非最优方案:令 000(2) 替换第 1 种单词,001(2) 替换第 2 种单词,01(2) 替换第 3 种单词,1(2) 替换第 4 种单词。在这种方案下,编码以后的最短长度为:
 

1×3+1×3+2×2+2×1=12

最长字符串 si 的长度为 3。与最优方案相比,文章的长度相同,但是最长字符串的长度更长一些。
 

对于所有数据,保证 2≤n≤100000,2≤k≤9。
 

选手请注意使用 64 位整数进行输入输出、存储和计算。

 二、题目释义

构建一棵K叉哈夫曼树,计算最小加权路径值与树高

三、思路分析

这里有几个需要计算的地方,第一就是所给的n个结点都是叶结点,可能会出现构造过程中无法生成一棵完全K叉树,那答案就会失真,所以首先计算是否需要补充权值为0的虚节点,若需要补充,则需要补充几个,所以计算虚节点个数m成了关键

输入n个叶节点,构造一棵k叉哈夫曼树

这个得到的过程只能在最后得到结果,即最后发现所有合并后的节点与未合并的节点个数<k,则需要补充(k-最后剩下的节点个数),如何计算最后剩下的节点个数,模拟合并的过程,都是在n中选取k个节点然后生成一个新的节点,所以不断的迭代当

(n = n-k+1 )< k时补充 k-n个虚节点

表示为循环即为while(n%(k-1)!=1)n++;

也可以发现其中的规律,虚节点个数m为 

if((n-1)%(k-1))
{
  m = (k-1) - (n-1)%(k-1);
}

四、AC代码

经历了一个半小时debug的痛苦..最后发现是这个题的OJ对long long 不接受 %I64d,只认%lld..

#include <iostream>
#include <cstdio>
#include <queue>

using namespace std;
const int N = 1e5+5;
typedef long long LL;

struct HTNode
{
    LL wei;
    int dep;
}node;

LL sumL;
int maxDep;

bool operator < (const HTNode& a,const HTNode& b)
{
    if(a.wei != b.wei) return a.wei > b.wei;
    else return a.dep > b.dep;
}
priority_queue<HTNode> pq;

int main()
{
    int n,k;
    int m = 0;
    scanf("%d%d",&n,&k);
    for(int i=1; i<=n; i++)
    {
        scanf("%lld",&node.wei);
        node.dep = 0;
        pq.push(node);
    }
    /**if((n-1)%(k-1))
        m = (k-1) - (n-1)%(k-1);*/ //这是根据公式推导出来的计算方式,后面的循环更好理解,都是为了计算手动添加的虚结点
    m = n;
    if(k!=2)
    {
        while(m%(k-1)!=1)
            m++;
    }
    m -= n;
    for(int i=1; i<=m; i++)
    {
        node.wei = 0, node.dep = 0;
        pq.push(node);
    }
    while(pq.size()>1)
    {
        node.wei = 0, node.dep = 0;
        int tempMaxDep = 0;
        for(int i=1; i<=k; i++)
        {
            HTNode temp = pq.top();
            pq.pop();
            node.wei += temp.wei;
            tempMaxDep = max(tempMaxDep,temp.dep);
        }
        node.dep = tempMaxDep + 1;
        maxDep = max(maxDep,node.dep);
        sumL += node.wei;
        pq.push(node);
    }
    printf("%lld
%d",sumL,maxDep);
    return 0;
}