пятница, 15 апреля 2022 г.

Unicode and MUMPS

На комитете MDC обсуждали поддержку юникода. Так и не смог понять что именно американцы предлагают потому как предлагают пока только светлое будущее без внятного описания как именно.

У юникода в М есть масса проблем:
  1. работа последовательных устройств в модели команд READ WRITE
  2. как интерпретировать то, что прочитано, в виде символов
  3. как сортировать строки трактуя их как юникод
Если есть примеры как сортировать строки например с циркумфлексами португальского и финского (ну или шведского) одновременно то велкам, чего уж там.

Ну и яркая битва для русскоязычных читателей - а как сортировать кириллицу если на ней несколько алфавитов.

Ну хотя бы взять такую задачку - как поступить с потоком байт чтобы слова "ель" и "ёжик" сортировались корректно, по алфавиту.

В MiniM эта задача решается заданием внешнего collation, но увы это только для одного алфавита. Как смешать несколько алфавитов, например строки русского, украинского и казахского языков в кириллической записи?

Комментариев нет:

Отправить комментарий