utf8 с разницей utf8mb4 Mysql, utf8mb4_bin, utf8mb4_general_ci, utf8mb4_unicode_ci разницы

UTF-8 используется от 1 до 4 байт, формат кодирования с переменной длиной, кодировки символов. MB4 т.е. наиболее байты 4, используют 4 байта для представления полной UTF-8.

MySQL utf8, кодирующий максимальную длину 3 байта, если они являются 4-байтовое символ будет вставлен аномалия. Три байта Unicode, UTF-8 кодировка символы максимальной энергии является 0xFFFF, то есть основная плоскость в многоязычном Unicode (BMP). То есть, любой символ, не Unicode основной многоязычной текста плоскость, вы не можете использовать набор символов utf8 хранятся в Mysql. В том числе выражение Emoji (Emoji специальная кодировка Unicode, общее в ИУ и андроид мобильных телефонов), и многие из них не являются широко используются китайские иероглифы, а также любые новые символы Unicode и так далее.

Резюме: MySQL является utf8 является utfmb3, только три байта, экономя пространство, но не может выразить все UTF-8. Рекомендуется использовать utf8mb4.

utf8mb4_bin: строка каждого символа хранятся двоичные данные, собранные с учетом регистра, и его можно хранить двоичного содержимого.

utf8mb4_general_ci: CI т.е. чувствительны к регистру, чувствительны к регистру. Не осуществлять сверку Unicode, в лице какого-либо специального языка или набора символов, сортировать результаты могут быть противоречивыми. Тем не менее, в большинстве случаев, порядок этих специальных символов не нужно, чтобы точно.

utf8mb4_unicode_ci: основан на стандарте Unicode для сортировки и сравнения, может точно рода между различными языками, Unicode порядок сортировки, чтобы иметь возможность обрабатывать особый характер ситуации, чтобы достичь нескольких более сложного алгоритма сортировки.

utf8mb4_general_ci является наследие сверки, не поддерживает расширение, можно провести сравнение между персонажами одного только один. Сравните скорость utf8_general_ci сортировки выполняется быстро, но по сравнению с utf8mb4_unicode_ci обобщению, сравнение правильности бедных.

Резюме: general_ci быстрее, unicode_ci более точным. Но теперь по сравнению с CPU, достаточно далеко , чтобы рассмотреть факторы эффективности, индекс участие, SQL дизайн. Пользователи должны быть обеспокоены набор символов и порядок сопоставления необходимости быть объединены в дб. (Поле может не искаженно в качестве первичного ключа или уникального индекса, например: в URL , как уникальный индекс, но это запись может быть
. Искажена) ----------------
Copyright : эта статья CSDN блоггер «оригинал статьи yzh_1346983557», следовать CC 4.0 BY-SA авторского договора Приводимый, пожалуйста , приложите ссылку первоисточника и это утверждение.
Оригинальная ссылка: https: //blog.csdn.net/yzh_1346983557/article/details/89643071

рекомендация

отwww.cnblogs.com/tc310/p/11824328.html