跳转至

洛谷-P3370 [模板] 字符串哈希

题目描述

如题,给定 N个字符串(第 i 个字符串长度为 M_i,字符串内包含数字、大小写字母,大小写敏感),请求出 N 个字符串中共有多少个不同的字符串。

#友情提醒:如果真的想好好练习哈希的话,请自觉,否则请右转PJ试炼场:)

输入格式

第一行包含一个整数 N*N*,为字符串的个数。

接下来 N*N* 行每行包含一个字符串,为所提供的字符串。

输出格式

输出包含一行,包含一个整数,为不同的字符串个数。

输入输出样例

输入 #1

5
abc
aaaa
abc
abcc
12345

输出 #1

4

说明/提示

对于 30\%30% 的数据:N\leq 10*N*≤10,M_i≈6*M**i*≈6,Mmax\leq 15*M**m**a**x*≤15。

对于 70\%70% 的数据:N\leq 1000*N*≤1000,M_i≈100*M**i*≈100,Mmax\leq 150*M**m**a**x*≤150。

对于 100\%100% 的数据:N\leq 10000*N*≤10000,M_i≈1000*M**i*≈1000,Mmax\leq 1500*M**m**a**x*≤1500。

样例说明:

样例中第一个字符串(abc)和第三个字符串(abc)是一样的,所以所提供字符串的集合为{aaaa,abc,abcc,12345},故共计4个不同的字符串。

Tip: 感兴趣的话,你们可以先看一看以下三题:

BZOJ3097:http://www.lydsy.com/JudgeOnline/problem.php?id=3097

BZOJ3098:http://www.lydsy.com/JudgeOnline/problem.php?id=3098

BZOJ3099:http://www.lydsy.com/JudgeOnline/problem.php?id=3099

如果你仔细研究过了(或者至少仔细看过AC人数的话),我想你一定会明白字符串哈希的正确姿势的_


字符串哈希的板子题,这个题的数据并不是很强,并不需要进行冲突处理,做到了完美哈希。

#include <bits/stdc++.h>

using namespace std;

typedef unsigned long long ull;

vector<ull> hashValue(10005);
ull P = 13331;

ull calculate(const string & s)
{
    int n = s.size();
    ull res = 0;
    for (int i = 0; i < n; ++i) res = res * P + (ull)s[i];

    return res;
}

int main()
{
    std::ios_base::sync_with_stdio(false);
    cin.tie(NULL);
    cout.tie(NULL);

    int strNum; cin >> strNum;
    string s;

    for (int i = 1; i <= strNum; ++i) {
        cin >> s;
        hashValue[i] = calculate(s);
    }

    sort(hashValue.begin() + 1, hashValue.begin() + 1 + strNum);

    int cnt = 1;
    for (int i = 2; i <= strNum; ++i) {
        if (hashValue[i] != hashValue[i - 1]) ++cnt;
    }

    cout << cnt << endl;

    return 0;
}