Trie 树(字典树)

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/zxm1306192988/article/details/82313841

字典树(Trie)可以保存一些 字符串->值 的对应关系。
基本上,它跟 Java 的 HashMap 功能相同,都是 key-value 映射,只不过 Trie 的 key 只能是字符串。

它的优点是:最大限度地减少无谓的字符串比较,查询效率比哈希表高。

Trie的核心思想是空间换时间。利用字符串的公共前缀来降低查询时间的开销以达到提高效率的目的。

查询的复杂度是O(len),len为Trie树的平均高度,也就是字符串的平均长度。

建立+查询在trie中是可以同时执行的,建立trie的复杂度为O(n*len),n为字符串的个数。

对于某一个单词,我们要询问它的前缀是否出现过。这样hash就不好搞了,而用trie还是很简单。

Trie树3个基本性质:

  1. 根节点不包含字符,除根节点外每一个节点都只包含一个字符。
  2. 从根节点到某一节点,路径上经过的字符连接起来,为该节点对应的字符串。
  3. 每个节点的所有子节点包含的字符都不相同。

假设有b,abc,abd,bcd,abcd,efg,hii 这6个单词,我们构建的树就是如下图这样的:

这里写图片描述

典型例题:

统计难题

hud

Problem Description
Ignatius最近遇到一个难题,老师交给他很多单词(只有小写字母组成,不会有重复的单词出现),现在老师要他统计出以某个字符串为前缀的单词数量(单词本身也是自己的前缀).

Input
输入数据的第一部分是一张单词表,每行一个单词,单词的长度不超过10,它们代表的是老师交给Ignatius统计的单词,一个空行代表单词表的结束.第二部分是一连串的提问,每行一个提问,每个提问都是一个字符串.

注意:本题只有一组测试数据,处理到文件结束.

Output
对于每个提问,给出以该字符串为前缀的单词的数量.

Sample Input

banana
band
bee
absolute
acm

ba
b
band
abc

Sample Output

2
3
1
0

题解:

import java.util.Scanner;
public class Main {
    public static void main(String[] arg) {
        Scanner scanner = new Scanner(System.in);
        Trie root = new Trie();
        String str = scanner.nextLine();
        while (!str.equals("")) {
            insert(root, str);
            str = scanner.nextLine();
        }
        while (scanner.hasNext()) {
            str = scanner.nextLine();
            System.out.println(search(root, str));
        }
    }

    private static void insert(final Trie root, String str) {
        Trie cur = root;
        int idx;
        for (int i = 0; i < str.length(); i++) {
            idx = str.charAt(i) - 'a';
            if (cur.child[idx] == null) {
                cur.child[idx] = new Trie();
            }
            cur = cur.child[idx];
            cur.ch = str.charAt(i);
            cur.cnt = cur.cnt + 1;
        }
    }

    private static int search(final Trie root, String str) {
        int cnt = 0;
        Trie cur = root;
        int idx;
        for (int i = 0; i < str.length(); i++) {
            idx = str.charAt(i) - 'a';
            if (cur.child[idx] == null) {
                return 0;
            }
            cur = cur.child[idx];
            cnt = cur.cnt;
        }
        return cnt;
    }
}

// Trie树每个结点
class Trie {
    char ch; // 代表字符
    int cnt; // 记录前缀数
    Trie[] child;

    public Trie() {
        cnt = 0;
        child = new Trie[26];
    }
}

猜你喜欢

转载自blog.csdn.net/zxm1306192988/article/details/82313841