|
MathML (Mathematical Markup Language)
авайте возьмем для примера выражение (a + b) 2 и рассмотрим на практике описанные выше принципы. Одним из вариантов разметки представления для этого выражения будет такой:<mrow><msup><mfenced><mrow><mi>a</mi><mo>+</mo><mi>b</mi></mrow></mfenced><mn>2</mn></msup></mrow>Этот пример демонстрирует использование различных элементов представления. Первый элемент, очень широко используемый, это элемент mrow. Он используется для обозначения ряда данных с выравниванием по горизонтали. Данные, содержащиеся между тегами <mrow> и </mrow> рассматриваются как аргумент элемента mrow. Таким образом, в элементе mrow содержится целое выражение. Как было замечено ранее, большинство математических выражений состоят из подвыражений. Эти подвыражения, в свою очередь, также содержатся в элементе mrow. Например, a + b также содержится в mrow.Элемент mfenced используется для ограничения формул различными типами скобок. По умолчанию используются круглые скобки.Обратите внимание на использование элемента mi для отображения переменных a и b и элемента mo для выделения оператора +.Элемент msup применяется в выражениях с верхними индексами и имеет два аргумента: основание (в нашем случае (a+b)) и показатель (в нашем случае 2).Разметка содержания для того же примера будет иметь вид:<mrow><apply><power/><apply><plus/><ci>a</ci><ci>b</ci></apply><cn>2</cn></apply></mrow>Элемент apply обозначает применение операции к выражению. В нашем примере применяются пустой элемент power (для возведения в степень) и аналогичный элемент plus (для сложения). Обратите внимание, что оба оператора имеют два аргумента. Но если в случае возведения в степень их порядок важен лишь отчасти, то в случае применения apply он имеет ключевое значение, так как первый дочерний элемент является оператором, принимающим остальные в качестве аргумента.Обратите внимание на использование элемента ci для выделения переменных a и b, и элемента cn для выделения числа 2.1.4.2 Разметка представленияРазметка представления MathML состоит из приблизительно 30 элементов, которые имеют более 50 атрибутов. Большинство элементов представляют из себя схемы форматирования, которые содержат в себе другие элементы представления. Каждая схема соответствует двумерному фрагменту нотации, такому как верхний или нижний индекс, дробь или таблица. Кроме того, в разметке представления есть описанные выше токены mi, mo и mn и несколько других, которые используются не так часто. Несколько оставшихся элементов представления - это пустые элементы, связанные, в основном, с выравниванием.Все схемы форматирования делятся на несколько классов. Одна группа элементов отвечает за индексы и содержит такие элементы, как msub munder, и mmultiscripts. Другая отвечает за более общее форматирование и включает элементы mrow, mstyle и mfrac. Третья группа реализует работу с таблицами. Элемент maction образует еще одну категорию и позволяет кодировать различные типы действий над нотацией, встречающиеся в выражениях, которые toggles between two pieces of notation.Схемы форматирования обладают важным свойством: важен порядок их дочерних элементов. Например, первый дочерний элемент схемы mfrac является числителем дроби, а второй - знаменателем. Так как порядок дочерних элементов не задается на уровне XML с помощью MathML DTD, информация о порядке доступна только препроцессору MathML, в отличие от общего препроцессора XML. Когда мы хотим подчеркнуть, что элементы MathML, такие как mfrac, требуют указания дочерних элементов в определенном порядке, мы рассматриваем их как аргументы, а mfrac - как 'конструктор' нотации.1.4.3 Разметка содержанияРазметка содержания содержит около 120 элементов, принимающих около дюжины атрибутов. Большинство этих элементов - пустые, соответствующие различным математическим операторам, зависимостям и функциям. В качестве примера можно привести partialdiff, leq и tan. Другие, такие как matrix и set, используются для представления различных типов математических данных. Третья важная категория элементов разметки содержания, такая как apply, используется для применения к выражениям операций и создания новых математических объектов.Возможно, одним из наиболее важных элементов содержания является apply. Он используется для применения функции или операции к набору аргументов. Здесь также важно положение дочерних элементов: первый дочерний элемент указывает применяемую функцию, остальные - аргументы в соответствующем порядке. Надо отметить, что конструкция apply всегда использует префиксную нотацию, как язык программирования LISP. В частности, даже бинарные операторы, такие как вычитание, описываются применением префиксного оператора вычитания к двум аргументам. Например, a - b будет описано так:<mrow><apply><minus/><ci>a</ci><ci>b</ci></apply></mrow>Многие функции и операции, для того чтобы четко определенными, требуют одного или нескольких кванторов. Например, кроме подинтегрального выражения у определенного интеграла должны быть заданы пределы интегрирования и переменная, по которой происходит интегрирование. По этой причине существует несколько схем-спецификаторов вроде bvar и lowlimit. Они используются с операторами diff и int.Конструкция declare особенно важна для разметки содержания, которая может обрабатываться системами компьютерной алгебры. Элемент declare реализует основной механизм присваивания, когда может быть объявлена переменная определенного типа с определенным значением.И в примерах разметки представления, и в примерах разметки содержания математические выражения рекурсивно разлагаются на вложенные, более простые элементы MathML, определяющие стадию декомпозиции. В следующем разделе это проиллюстрировано на более сложных примерах.1.4.4 Объединение представления и содержанияДля разных типов задач различные типы разметки могут быть наиболее подходящими. Документы, созданные до широкого распространения Сети, очень часто предназначены только для визуального обмена информацией и наилучшим образом преобразуются в чистую разметку представления, так как семантическая информация, которую подразумевал автор, может быть восстановлена только эвристически. Наоборот, некоторые математические приложения и средства обучения основаны на содержании. Большинство же приложений находятся посредине между этими крайностями. Для них наиболее подходящим вариантом является объединение разметки представления и содержания.Правила объединения разметки представления и содержания следуют из общего принципа, что смешанная разметка может быть только в тех местах, где она действительно необходима. Для разметки содержания, встроенной в разметку представления, это означает, что любые фрагменты содержания должны быть семантически значимыми и не требовать дополнительных аргументов или кванторов для того, чтобы быть четко определенными. Для разметки представления, встроенной в разметку содержания, это означает, что разметка представления должна содержаться в токене разметки содержания как неделимый элемент, используемый в качестве имени переменной или функции.Другой способ заключается в использовании элемента semantics. Он используется для связывания выражений MathML и различных типов примечаний. Чаще всего элемент semantics используется для того, чтобы присоединить фрагмент разметки содержания к разметке представления как семантическое примечание. Таким образом, автор может определить нестандартную нотацию, которая будет использоваться при отображении конкретного выражения. Другим применением элемента semantics является включение других семантических спецификаций, таких как OpenMath выражения, в выражения MathML. В этом случае, элемент semantics может быть использован для расширения разметки содержания MathML.1.5 MathML в документахВсе вышесказанное относится к отдельным формулам вне контекста документа. Давайте подробно рассмотрим пример, соответствующий примеру "Hello, World!", разбираемому при изучении языков программирования. Мы представим полный код документа XHTML 1.0, содержащего рассмотренный выше квадрат суммы двух переменных:<html xmlns="http://www.w3.org/1999/xhtml" lang="en" xml: lang="en"><head><title>MathML's Hello Square</title></head><body><p> This is a perfect square: </p><math xmlns="http://www.w3.org/1998/Math/MathML"><mrow><msup><mfenced><mrow><mi>a</mi><mo>+</mo><mi>b</mi></mrow></mfenced><mn>2</mn></msup></mrow></math></body></html>Это стандартная структура документа XHTML. Он начинается открывающим тегом <html>, содержащим декларацию пространства имен XML и объявление языка. Элемент head содержит, как обычно, заголовок. Открывающий тег <body> beginning also has a namespace declaration of an abbreviative prefix letter m to be used for the standard MathML namespace. Затем идет обычный параграф. И, наконец, идет элемент math, который также имеет декларацию пространства имен. Внутри элемента math находится разметка MathML.1.6 Примеры MathMLДалее мы будем приводить примеры в форме фрагментов разметки MathML, которые в реальном документе расположены в элементе math.1.6.1 Примеры разметки представленияНотация: x2 + 4x + 4 = 0.Разметка:<mrow><mrow><msup><mi>x</mi><mn>2</mn></msup><mo>+</mo><mrow><mn>4</mn><mo>⁢ </mo><mi>x</mi></mrow><mo>+</mo><mn>4</mn></mrow><mo>=</mo><mn>0</mn></mrow>Обратите внимание на использование вложенных элементов mrow для обозначения термов. Например, левая часть уравнения является операндом для '='. Выделение термов значительно улучшает структуру для визуального отображения, воспроизведения с помощью голоса и переноса строк. Символ MathML InvisibleTimes применяется для того, чтобы сообщить программе отображения, что между 4 и x запрещен перенос строки. На самом деле, такое использование данного элемента, введенного еще в MathML 1.0, не рекомендуется. Все обычные текстовые данные задаются кодами Unicode. Тем не менее, хотя символ для замены ⁢ ожидается в Unicode 3.2, и рассматриваются предложения по улучшению Unicode, в текущей версии Unicode 3.0 такого символа не используется. Мы можем использовать ожидаемую цифровую ссылку ࠎ но для понятности будем продолжать использовать в примерах элемент InvisibleTimes.Разметка:<mrow><mi>x</mi><mo>=</mo><mfrac><mrow><mrow><mo>-</mo><mi>b</mi></mrow><mo>± </mo><msqrt><mrow><msup><mi>b</mi><mn>2</mn></msup><mo>-</mo><mrow><mn>4</mn><mo>⁢ </mo><mi>a</mi><mo>⁢ </mo><mi>c</mi></mrow></mrow></msqrt></mrow><mrow><mn>2</mn><mo>⁢ </mo><mi>a</mi></mrow></mfrac></mrow>Элементы mfrac и msqrt используются для создания дроби и квадратного корня соответственно.Обратите внимание, что знак 'плюс-минус' задается специальной сущностью ±, хотя в данном случае существует такой символ Unicode, как �B1;. MathML предоставляет обширный список имен элементов, задающих математические символы. В дополнение к математическим символам для вывода документа на экран и на печать, MathML предоставляет символы для воспроизведения документа с помощью речи. Для воспроизведения с помощью речи важно автоматически определять, как должен быть прочитан фрагмент<mrow><mi>z</mi><mfenced><mrow><mi>x</mi><mo>+</mo><mi>y</mi></mrow></mfenced></mrow>Как 'z умножить на величину x плюс y' or 'z умножить на x плюс y'. Символы ⁢ (U+2062) и ⁡ (U+2061) предоставляют авторам способ напрямую кодировать такие различия для программ речевого воспроизведения. Например, в первом случае, символ ⁢ (U+2062) должен быть вставлен после строки, содержащей z. MathML также содержит такие сущности как ⅆ (U+2146), представляющая дифференциал. При печати она отображается с отличными от обычного символа 'd' интервалами, а произноситься может как 'd' или 'with respect to'. Пока для исключения двусмысленности используются теги содержания или любой другой механизм, авторы всегда должны использовать описанные выше символы как сущности для того, чтобы сделать документы более доступными.Разметка:<mrow><mi>A</mi><mo>=</mo><mfenced open=" [" close="] "><mtable><mtr><mtd><mi>x</mi></mtd><mtd><mi>y</mi></mtd></mtr><mtr><mtd><mi>z</mi></mtd><mtd><mi>w</mi></mtd></mtr></mtable></mfenced></mrow>Элемент mtable указывает на начало таблицы в MathML. Элемент mtr определяет строку таблицы и элемент mtd содержит данные для элемента строки (ячейки). Большая часть элементов имеет атрибуты, определяющие свойства отображения на экране и на печати. Например, у элемента mfenced есть атрибуты, определяющие, какие символы должны использоваться в начале и в конце группируемого выражения. Атрибуты элементов-операторов устанавливаются в определенное справочником значение по умолчанию при помощи элемента <mo>.1.6.2 Примеры разметки содержанияНотация: x2 + 4x + 4 = 0.<mrow><apply><eq/><apply><plus/><apply><power/><ci>x</ci><cn>2</cn></apply><apply><times/><cn>4</cn><ci>x</ci></apply><cn>4</cn></apply><cn>0</cn></apply></mrow>Обратите внимание, что элемент apply используется для уравнений, операторов и функций.Разметка содержания MathML не содержит элемента для отображения операции 'плюс-минус'. Поэтому мы используем элемент mo для объявления, что мы хотим применить разметку представления для этого оператора в качестве оператора содержания. Это простой пример того, как разметки представления и содержания могут быть объединены для расширения разметки содержания. Нотация: Разметка:<mrow><apply><eq/><ci>A</ci><matrix><matrixrow><ci>x</ci><ci>y</ci></matrixrow><matrixrow><ci>z</ci><ci>w</ci></matrixrow></matrix></apply></mrow>Здесь мы используем элементы matrix и matrixrow для помещения содержания в строку матрицы. Заметьте, что по умолчанию отображение элемента содержания matrix включает в себя ограничивающие круглые скобки, а, значит, нет необходимости кодировать их вручную. В этом состоит отличие от элемента представления mtable, который может и не относиться к матрице, и, следовательно, требует отдельного указания, что надо использовать скобки.1.6.3 Примеры смешанной разметкиНотация: 3 Разметка:<mrow><semantics><mrow><msubsup><mo>∫ </mo><mn>1</mn><mi>t</mi></msubsup><mfrac><mrow><mo>ⅆ </mo><mi>x</mi></mrow><mi>x</mi></mfrac></mrow><annotation-xml encoding="MathML-Content"><apply><int/><bvar><ci>x</ci></bvar><lowlimit><cn>1</cn></lowlimit><uplimit><ci>t</ci></uplimit><apply><divide/><cn>1</cn><ci>x</ci></apply></apply></annotation-xml></semantics></mrow>В этом примере мы используем элемент semantics для того, чтобы представить выражение разметки содержания MathML как семантическое примечание к выражению разметки представления. В представленной разметке элемент msubsup применяется для задания нижних и верхних индексов в выражении, в данном случае - пределов интегрирования в определенном интеграле. Также для описания символов интеграла и дифференциала используются сущности ∫ и ⅆ.Элемент semantics содержит в качестве первого дочернего элемента комментируемое выражение, а в качестве второго - сам комментарий. На тип нотации, задаваемой элементом semantics, ограничений не существует. Например, можно задавать разметку TEX или компьютерной алгебры в качестве примечания. Тип аннотации задается атрибутом encoding и элементами annotation, annotation-xml.Элемент semantics также часто применяется, когда надо задать предложения по представлению разметки содержания документа. В этом случае, в применении к вышеописанной формуле мы получим такую разметку:<semantics><apply><int/><bvar><ci>x</ci></bvar><lowlimit><cn>1</cn></lowlimit><uplimit><ci>t</ci></uplimit><apply><divide/><cn>1</cn><ci>x</ci></apply></apply><annotation-xml encoding="MathML-Presentation"><mrow><msubsup><mo>∫ </mo><mn>1</mn><mi>t</mi></msubsup><mfrac><mrow><mo>ⅆ </mo><mi>x</mi></mrow><mi>x</mi></mfrac></mrow></annotation-xml></semantics>Этот тип комментариев полезен, если требуется отображение разметки содержания, отличное от заданного по умолчанию. Например, по умолчанию, некоторые программы отображения могут выводить подинтегральное выражение в виде ' (1/x) dx'. С помощью комментария MathML-Presentation можно задать отображение в виде 'dx/x'. Будьте внимательны, так как программы отображения не обязаны принимать во внимание расположенную в комментариях информацию. Ее использование зависит от программы.1.7 Синтаксис и грамматика MathML1.7.1 Синтаксис и грамматика MathMLMathML основан на [XML] (Extensible Markup Language), а значит его синтаксис подчиняется правилам сиснтаксиса XML, и грамматика определяется DTD (Document Type Definition). Другими словами, детали использования тегов, атрибутов, сущностей и всего остального определены в спецификации языка XML, а детали, касающиеся элементов и атрибутов MathML, вложенности элементов и так далее, определены в MathML DTD.W3C, стараясь увеличить легкость и гибкость использования XML в Сети и поддержать создание модульных XML-приложений, обнаружил, что основная форма DTD не является достаточно гибкой. Поэтому, была создана рабочая группа W3C для разработки XML Schemas, которые являются документами спецификации и должны заменить DTD. MathML 2.0 разработан так, что математики могли использовать все преимущества развивающихся Web-технологий. Таким образом, существует схема для MathML.Также MathML определяет синтаксические и грамматические правила в дополнение к общим правилам, которые он наследует как приложение XML. Эти правила позволяют MathML представлять значительно больше информации, чем возможно представить с помощью чистого XML, без введения большого числа новых элементов и использовать значительно более сложные DTD или схемы. Конечно, недостатком введения специфических правил MathML является то, что созданные документы не могут обрабатываться процессорами и валидаторами XML.Существует два основных типа дополнительных грамматических и синтаксических правил MathML. Первый тип включает в себя установку дополнительных критериев на значения атрибутов. Например, в чистом XML невозможно потребовать, чтобы значение атрибута было положительным целым числом. Второй тип правил определяет более детальные ограничения на дочерние элементы (например, на их порядок), чем даны в DTD или даже схемах. Например, в XML нельзя указать, что первый дочерний элемент должен обрабатываться иначе, чем остальные.1.7.2 Пример синтаксиса XMLТак как MathML основан на XML, спецификация MathML использует терминологию XML. Данные XML состоят из символов Unicodes (которые включают в себя обычные ASCII-символы), ссылки на сущности (неформально называемые сущностями), такие как <, которые обычно представляют расширенные символы, и элементы, такие как <mi fontstyle="normal"> x </mi>.Элементы часто содержат в себе другие XML-данные, называемые их 'содержанием' или 'телом', между 'открывающим' и 'закрывающим' тегами, также как в HTML. Существуют также 'пустые элементы', такие как <plus/>, у которых открывающий тег заканчивается символом />, чтобы показать, что элемент не имеет содержания или закрывающего тега. Открывающий тег должен содержать именованные параметры, называемые атрибутами, например, fontstyle="normal" в приведенном выше примере.Так как большие и маленькие буквы различаются в XML, то и имена элементов и атрибутов MathML являются чувствительными к регистру. Для удобочитаемости в спецификации MathML большинство из них определены в нижнем регистре.В формальном обсуждении разметки XML делается различие между элементом, таким как mrow и задающими его тегами <mrow> и </mrow>. То, что находится между тегами <mrow> и </mrow>, называется содержанием или телом элемента mrow. 'Пустой элемент', например none, не имеет тела и определяется одним тегом вида <none/>. В этой спецификации не будет делаться упора на это различие между тегами и элементами. Например, мы иногда будем ссылаться на элементы <mrow> и <none/>, подразумевая элемент, которому принадлежат эти теги. Это делается для того, чтобы ссылки на элементы отличались от ссылок на атрибуты. Тем не менее, термины 'элемент' and 'тег' будут использоваться в строгом соответствии с терминологией XML.1.7.3 Дочерние элементы против аргументовМногие элементы MathML требуют определенного числа дочерних элементов или присваивают дополнительный смысл дочерним элементам, стоящим в определенной позиции. Как было отмечено выше, этот тип ограничений является специфическим для MathML и не может быть задан при помощи синтаксиса и грамматики XML. Когда дочерний элемент данного элемента MathML удовлетворяет этим дополнительным условиям, мы будем говорить о нем как об аргументе, а не о дочернем элементе, чтобы подчеркнуть специфичность его использования. Заметьте, что термин 'аргумент' применяется именно в этом техническом смысле, если не указано обратное.Некоторые элементы имеют другие требования на число или тип аргументов. Эти дополнительные требования описываются для каждого конкретного элемента.1.7.4 Значения атрибутов MathMLВ соответствии со спецификацией языка XML, атрибуты элементов должны быть заданы в одной из следующих форм:attribute-name = "value"orattribute-name = 'value'где пробелы вокруг знака '=' необязательны.Имена атрибутов выделены в тексте спецификации моноширинным шрифтом, так же как и примеры.Значения атрибутов, которые в MathML могут быть строкой произвольных символов, должны быть заключены в двойные (") или одинарные (') кавычки. Значение атрибута может содержать тот тип кавычек, который не используется для заключения всего значения.MathML использует более сложный синтаксис для значений атрибутов, чем общий синтаксис XML, задаваемый MathML DTD. Эти дополнительные правила предназначены для приложений MathML, и их нарушение является ошибкой MathML, однако они не могут быть отслежены процессорами XML. Синтаксис значений элементов MathML определен в таблице атрибутов и сопровожден описанием каждого элемента, используя описанную ниже нотацию. Когда приложение MathML обрабатывает значения атрибутов, все пробелы, за исключением разделяющих отдельные слова или числа, игнорируются. Символьные данные могут быть включены в значения атрибутов напрямую или с использованием ссылочных сущностей.В частности, символы ", ', & и < могут быть включены в значения атрибутов MathML (когда это разрешено синтаксисом) с использованием сущностей ", ', & и <, соответственно.MathML DTD, объявляет типы большинства значений атрибутов как строку CDATA. Это позволяет увеличить совместимость с существующим программным обеспечением на основе SGML и XML и расширять список предопределенных значений. Подобные же рассуждения применимы к схемам XML.1.7.4.1 Синтаксические нотации, используемые в спецификации MathMLДля описания MathML-специфического синтаксиса допустимых значений атрибутов, в этом документе используются следующие соглашения и нотации. |
Нотация | Что означает | | number | десятичное целое или рациональное число (строка цифр с одной десятичной точкой), возможно, начинающееся со знака '-' | | unsigned-number | десятичное целое или вещественное число, без знака | | integer | десятичное целое число, возможно, начинающееся со знака '-' | | positive-integer | десятичное целое число, без знака, не 0 | | string | произвольная строка (всегда полное значение атрибута) | | character | одиночный непробельный символ или ссылочая сущность MathML; возможно разделение пробелами | | #rrggbb | цвет в формате RGB; три пары шестнадцатиричных цифр в примере #5599dd определяют пропорцию красного, зеленого и синего по шкале от x00 до xFF, которая дает яркий голубой цвет. | | h-unit | единица измерения горизонтальной длины (допустимые единицы измерения перечислены ниже) | | v-unit | единица измерения вертикальной длины (допустимые единицы измерения перечислены ниже) | | css-fontfamily | объясняется ниже, в подразделе о CSS | | css-color-name | объясняется ниже, в подразделе о CSS | | остальные слова, выделенные курсивом | объясняются в тексте, отдельно для каждого атрибута | | form + | один или более экземпляров 'form' | | form * | нуль или более экземпляров 'form' | | f1 f2... fn | один экземпляр каждой формы, последовательно, возможно разделенные пробельными символами | | f1 | f2 |... | fn | любая из указаных форм | | [form] | необязательный экземпляр 'form' | | (form) | то же самое, что и просто form | | невыделенные слова | слова, включеные в значени атрибута дословно (есди это не часть объясняющей фразы) | | символы в кавычках | символы, дословно включенные в значение атрибута (например, "+" or '+') | | |
Приоритет операция, от наивысшего к наинизшему: form + или form * f1 f2... fn (последовательность форм) f1 | f2 |... | fn (одна из форм) Тип string может содержать произвольные символы, которые определены в значениях атрибута XML CDATA. В MathML нет синтаксических правил, по которым string может быть частью значения атрибута, а не всем значением. Соседние ключевые слова и числа в значениях атрибутов должны разделяться пробельными символами, за исключением следующих за числами идентификаторов единиц измерения (что указано в синтаксисе символов h-unit и v-unit). Пробельные символы не требуются, но разрешены между любыми перечисленными выше токенами, за исключением (для совместимости с CSS) непосредственно перед идентификаторами единиц измерения, между знаком '-' и числами, между # и rrggbb или rgb. Значения числовых атрибутов, которые задают размеры и должны зависеть от текущего шрифта, могут задаваться в связанных со шрифтом единицах измерения или в указанных абсолютных единицах (описанных ниже). Горизонтальные размеры обычно задаются в em, а вертикальные - в ex. Идентификаторы em или ex следуют непосредственно за числом. Например, горизонтальные отступы от оператора '+' обычно задаются в em, хотя могут использоваться и другие единицы измерения. Использование связанных со шрифтом единиц измерения предпочтительнее, чем абсолютных, так как они позволяют увеличивать или уменьшать размер отображаемого элемента в зависимости от текущего размера шрифта. Для большинства числовых атрибутов возможные значения ограничены некоторым подмножеством, другие значения ошибкой не являются (если не указано противное), а округляются программой отображения вверх или вниз до ближайшего допустимого. Множество допустимых значений может зависеть от программы отображения и не определяется MathML. Если числовое значение в соответствии с синтаксисом атрибута может содержать знак минус ('-'), например number или integer, то его использование в случае, когда отрицательные значения не существенны, ошибкой не является. Вместо этого, значение должно обрабатываться приложением так, как описано в предыдущем параграфе. Явное указание знака плюс ('+') как части числового значения запрещено за исключением тех случаев, когда это специально указано в синтаксисе (в виде '+' или "+"), и его присутствие может изменить смысл значения атрибута (как описано в каждом из таких атрибутов). Символы h-unit, v-unit, css-fontfamily, и css-color-name рассматриваются в следующих подразделах. 1.7.4.2 Атрибуты с единицами измеренияНекоторые атрибуты принимают горизонтальные и вертикальные размеры как числа, за которыми следует 'идентификатор единицы измерения' (часто называемый 'единицей измерения'). Синтаксические символы h-unit и v-unit относятся к горизонтальным и вертикальным размерам соответственно. Возможные единицы измерения и размеры, к которым они относятся, перечислены в таблице, расположенной далее; они совпадают для горизонтальных и вертикальных размеров, но синтаксические символы отличаются (как напоминание используемого в них направления).Идентификаторы единиц измерения и их смысловое значение взяты из. Тем не менее, синтаксис числа с последующим идентификатором в MathML не идентичен синтаксису в CSS, так как числа в CSS не могут заканчиваться десятичной точкой и могут начинаться со знака '+'.Допустимые горизонтальные и вертикальные единицы измерения в MathML: |
Идентификатор | Описание | | em | em (единица измерения, зависящая от размера шрифта и обычно применяемая для горизонтальных размеров) | | ex | ex (единица измерения, зависящая от размера шрифта и обычно применяемая для вертикальных размеров) | | px | пиксель | | in | дюйм (1 дюйм = 2.54 сантиметра) | | cm | сантиметр | | mm | миллиметр | | pt | пункт (1 пункт = 1/72 дюйма) | | pc | picas (1 pica = 12 пунктов) | | % | процент от величины | | |
Типографские единицы измерения em и ex обсуждаются далее в пункте 'Дополнительные замечания'. % является 'относительной единицей измерения'; когда значение атрибута задано в виде n% (для любого числового значения n), значение определяется как значение по умолчанию, умноженное на n и поделенное на 100. Значение по умолчанию (или способ, которым его можно получить, если оно не является константой) описано в таблице атрибутов для каждого элемента, а его смысл описан в последующей документации по атрибуту. (Элемент mpadded имеет свой синтаксис для% и не позволяет использовать его как идентификатор единицы измерения) Для согласованности с CSS, единицы измерения длины в MathML могут быть необязательными. Когда это так, символ единицы измерения в синтаксисе атрибута заключается в квадратные скобки, например, число [h-unit]. Смысл значения атрибута без единиц измерения описан в документации для каждого атрибута; обычно указанное число умножается на значение по умолчанию. (В этом случае число nnn без единицы измерения эквивалентно числу nnn умноженному на 100 и со знаком %. Например, <mo maxsize="2"> (</mo> эквивалентно <mo maxsize="200 %"> (</mo>) Как исключение (тоже для совместимости с CSS), числовые значения равные нулю не требуют указания идентификатора единицы измерения даже если этого требует синтаксис. В этом случае наличие или отсутствие идентификатора единицы измерения не играет роли, так как любое число умноженное на 0 есть 0. Для большинства атрибутов в данной спецификации в качестве стандартных единиц измерения выбраны единицы, используемые в типографском наборе; когда не указано конкретное значение величины, то стандартные единицы измерения обычно указаны в таблице или в описании атрибута. Чаще всего используются такие единицы измерения как em или ex. Однако, могут использоваться любые единицы, если в описании конкретного атрибута не указано обратное. Отметим, что некоторые атрибуты, например framespacing в <mtable>, могут содержать более одного числового значения, после каждого из которых следует своя единица измерения. Принято использовать единицы измерения ex в основном для задания вертикальных размеров, а em - для горизонтальных, хотя это не является обязательным требованием. Эти единицы измерения зависят от шрифта, используемого для отображения элемента, в атрибутах которого они применяются, и его размера. А значит, они должны интерпретироваться после таких атрибутов, как fontfamily и fontsize, если они встречаются в одном элементе, так как изменение текущего шрифта или его размера может привести к изменению размера единиц измерения. Определение длины каждой единицы измерения (но не синтаксис MathML для значений длины) такое же как в CSS, за исключением тех случаев, когда шрифт устанавливает специальные значения для em и ex, отличающиеся от значений, определенных в CSS (font size и 'x'-height соответственно). 1.7.4.3 CSS-совместимые атрибутыНекоторые атрибуты MathML, перечисленные ниже, соответствуют свойствам отображения текста, определенным в CSS1. Это сделано для того, чтобы программы отображения могли запросить CSS-окружение о соответствующих свойствах при определении значений атрибутов по умолчанию.Возможность определения стилевых свойств через атрибуты MathML и CSS имеет и недостатки. Как минимум, это запутывает, а в худшем случае, это приводит к непреднамеренному изменению смысла уравнений при изменении CSS для всего документа. Поэтому, эти атрибуты осуждаются. В свою очередь, MathML 2.0 вводит четыре новых математических стилевых атрибута. Эти атрибуты используют логические значения для того, чтобы лучше передать абстрактные категории используемых в математике символов, и предоставляют четкое разделение между MathML и CSS.Следующая таблица показывает соответствие осуждаемых стилевых атрибутов MathML 1.01 и их CSS-аналогов: |
Атрибут MathML | Свойство CSS | синтаксический символ | Элемент MathML | | fontsize | font-size | - | токены представления; mstyle | | fontweight | font-weight | - | токены представления; mstyle | | fontstyle | font-style | - | токены представления; mstyle | | fontfamily | font-family | css-fontfamily | токены представления; mstyle | | color | color | css-color-name | токены представления; mstyle | | background | background | css-color-name | mstyle | | |
Порядок обработки атрибутов и стилевых таблиц. CSS или аналогичные стилевые таблицы могут задавать изменения свойств отображения элементов MathML. Так как свойства отображения могут изменяться как атрибутами элемента, так и программой отображения, необходимо определить порядок, в котором происходят изменения из разных источников. Примером автоматического согласования является ситуация с fontsize. В случае 'абсолютных' изменений, например, установки нового значения свойства, независимого от старого значения (в отличие от 'относительных' изменений, таких как инкремент или умножение на число), действуют только последние абсолютные изменения, поэтому источник изменений с наивысшим приоритетом должен обрабатываться последним. В случае CSS, порядок обработки изменений, действующих на свойства отображения элемента MathML, из различных источников должен быть следующим: (изменяется первым; самый низкий приоритет) Автоматические изменения свойств или атрибутов, основанных на типе родительского элемента и положении элемента в родительском (как упоминается выше об изменениях fontsize в соответствии с scriptlevel; такие изменения обычно применяются самим родительским элементом перед передачей свойств отображения текущему элементу Из стилевых таблиц читателя: стили, которые не объявлены 'важными' Явно заданные атрибуты текущего элемента MathML Из стилевых таблиц автора: стили, которые не объявлены 'важными' Из стилевых таблиц автора: стили, которые объявлены 'важными' Из стилевых таблиц читателя: стили, которые объявлены 'важными' (изменяется последним; самый высокий приоритет). Отметим, что порядок изменений, производимых стилевыми таблицами CSS, определен в самих CSS (это порядок, определяемый CSS2). Следующее объяснение относится только к случаю, когда в этом порядке происходят изменения, вызванные точным заданием атрибутов MathML. Объяснение: Атрибуты отображения в MathML аналогичны атрибутам отображения в HTML (таким как align), которые, согласно определенному в CSS порядку, должны обрабатываться с одинаковым приоритетом. Более того, такой выбор очередности позволяет читателям решить, определяя стили CSS 'важными', какие из их установок должны переопределять явные установки MathML. Так как выражения MathML, состоящие из элементов содержания или представления, в первую очередь предназначены для передачи смысла, а 'графическое представление' (если таковое имеется) должно помогать этому (но не является важным само по себе), вероятно, что читатели захотят, чтобы их стилевые предпочтения имели приоритеты. Основным исключением является ситуация, когда атрибуты отображения предполагают изменение смысла выражения. 1.7.4.4 Значения атрибутов по умолчаниюЗначения по умолчанию для атрибутов MathML как правило даются вместе с подробным описанием соответствующего элемента. Значения по умолчанию, указанные в таблицах атрибутов обычным шрифтом, являются точными (если они не являются очевидными объяснениями), выделенные курсивом фрагменты описывают, как значения по умолчанию могут быть вычислены.Значения по умолчанию, описанные как inherited, берутся из среды отображения, как описано для mstyle, или, в некоторых отдельно описанных случаях, из значений других атрибутов окружающих элементов, или из определенной части этих значений. Всегда используется значение, которое может быть задано точно, если оно известно; оно никогда не зависит от содержания или атрибутов данного элемента, только от его окружения. (Его смысл при использовании может, тем не менее, зависеть от этих атрибутов или содержания)Значения по умолчанию, описанные как automatic, должны вычисляться программой отображения таким образом, чтобы получить высококачественное изображение. Способ, как этого добиться, обычно не указан в спецификации MathML. Всегда используется значение, которое может быть задано точно, если оно известно; но оно обычно зависит от содержания элемента и, возможно, от среды отображения.Другие выделенные курсивом описания значений по умолчанию, которые встречаются в таблицах атрибутов, объясняются отдельно для каждого атрибута.Одинарные или двойные кавычки, в которые должны быть заключены значения атрибута, расположенного в открывающем теге XML, не показаны в синтаксисе значений в таблице атрибутов, но показаны в тексте примеров.Отметим, что, как правило, не существует значений, которые точно могут быть присвоены атрибутам MathML и имитируют эффект их отсутствия для атрибутов, являющихся inherited или automatic. Указание 'inherited' или 'automatic' точно не будет работать, и вообще запрещено. Более того, даже для атрибутов представления (для которых здесь приведены конкретные значения по умолчанию), должен использоваться элемент mstyle для изменения содержащихся в нем элементов. Поэтому, MathML DTD определяет большинство значений по умолчанию для атрибутов представления как #IMPLIED, что не позволяет обработчикам XML добавлять к этим атрибутам любые специальные значения по умолчанию. MathML schema работает по тем же правилам.1.7.4.5 Значения атрибутов в MathML DTDВ XML DTD, разрешенные значения атрибутов могут быть определены как общие строки, или могут быть различными способами ограничены (перечислением возможных значений, или указанием определенного типа данных). Выбор типа атрибута XML влияет на объем, в котором могут быть проведены проверки корректности с использованием DTD.MathML DTD определяет формальные типы атрибутов XML для всех атрибутов MathML, включая в некоторых случаях перечисления допустимых значений. В общем, тем не менее, MathML DTD является относительно нестрогим, часто определяя значения атрибутов как строки; это сделано для совместимости с парсерами SGML, которые допускают, чтобы несколько атрибутов одного элемента MathML принимали одинаковые значения (такие как true и false), и для того, чтобы позволить расширять список предопределенных значений.В то же время, даже если значение атрибута может быть определено как строка в DTD, только определенные значения являются допустимыми в MathML, как описано выше и в оставшейся части этой спецификации. Например, многие атрибуты требуют числовых значений. В следующем разделе описаны допустимые значения атрибутов для каждого элемента. Тем не менее, недостаток жесткости требований в DTD не подразумевает, что эти требования не являются частью MathML, или что они не могут быть усилены конкретной программой отображения MathML.Более того, MathML DTD предоставляется для удобства; хотя и подразумевается полная совместимость с текстом спецификации, текст должен быть определяющим в случае возникновения противоречий.1.7.5 Атрибуты, общие для всех элементов MathMLДля того чтобы облегчить использование таких стилевых механизмов, как XSLT и CSS2, все элементы MathML имеют атрибуты class, style, и id в дополнение к атрибутам, описанным для каждого элемента. Программы отображения MathML, не поддерживающие CSS, могут игнорировать эти атрибуты. MathML определяет значения этих атрибутов как общие строки, даже если стилевые механизмы имеют для них более строгий синтаксис. Поэтому, любое значение для них является допустимым в MathML.Для того чтобы обеспечить совместимость с механизмами связывания, все элементы MathML имеют атрибут xlink: href.Все элементы MathML также имеют атрибут xref для использования в параллельной разметке. id также используется в этом контексте.Каждый эдемент MathML, как наследство от MathML 1.0, также принимает осужденный атрибут other, который предполагался для передачи нестандартных атрибутов без нарушения MathML DTD. От программ отображения MathML требуется обработка этого атрибута только в том случае, если они реагируютя на все нестандартные атрибуты MathML. Тем не менн, использование атрибута other сильно осуждается, так как в MathML существуют другие способы передать специфическую информацию.1.7.6 Свертывание пробелов во вводеMathML игнорирует пробельные символы, встречающиеся вне токенов. Непробельные символы здесь запрещены. Пробельные символы, встречающиеся в содержании токенов, удаляются на концах, то есть удаляются все пробельные символы в начале и конце содержания. Пробельные символы, расположенные внутри содержания элементов MathML свертываются кононически, то есть каждая последовательность из 1 или более таких символов заменяется на 1 (иногда называемый пустым символом).В MathML, как и в XML, под пробельными символами подразумеваются простой пробел, табуляция, новая строка или перевод строки, то есть символы с кодами Unicode U+0020, U+0009, U+000A, U+000D соответственно.Например, <mo> (</mo> эквивалентно <mo> (</mo>, и<mtext>Теорема1:</mtext>эквивалентно <mtext>Теорема 1: </mtext>.Авторы, желающие поместить пробельные символы в начале или конце содержания токена, или последовательность более чем из одного пробельного символа так, чтобы они не были проигнорированы, должны использовать или другие неотображаемые пробельные символы. Например, сравните<mtext>Теорема1:</mtext>с<mtext> Теорема 1:</mtext>Когда отображается первый пример, перед словом 'Теорема' нет пробельных символов, один - между 'Теорема' и '1: ', и нет после '1: '. Во втором примере одиночный пробел будет отображен перед словом 'Теорема', два - перед '1: ', и ни одного после '1: '.Отметим, что атрибут xml: space в данной ситуации неприменим, так как процессоры XML передают пробельные символы в токенах процессору MathML; удаление происходит по правилам обработки MathML.Для пробельных символов, встречающихся вне содержания токенов mi, mn, mo, ms, mtext, ci, cn и annotation, должен использоваться элемент mspace, в противоположность элементу mtext содержащий только пробельные символы2. Возможности современных браузеров при работе с MathMLВ качестве тестового примера для демонстрации возможностей браузеров была создана простая XHTML-страница, содержащая примеры обоих разметок. Опишем основные требования к ней. Во-первых, это должны быть корректным XHTML-документом, то есть:быть корректным xml-документом;корневым элементом должен быть элемент html в пространстве имен XHTML, например:<html xmlns="http://www.w3.org/1999/xhtml">должен содержать декларацию типа документа. В нашем случае это:<! DOCTYPE html PUBLIC "- // W3C // DTD XHTML 1.1 plus MathML 2.0 // EN""http://www.w3.org/TR/MathML2/dtd/xhtml-math11-f. dtd">MathML-фрагменты должны принадлежать пространству имен MathML, например:<math xmlns="http://www.w3.org/1998/Math/MathML">... </math>Тестовый пример, который используется ниже: test. xhtml.2.1 Mozilla & FirefoxИспользуемая версия: Mozilla/5.0 (Windows; U; Windows NT 5.0; en-US; rv: 1.7 5) Gecko/20041107 Firefox/1.0.Mozilla и построенный на том же ядре Firefox имеют встроенные возможности отображения разметки MathML. Правда, до сих пор они ограничены лишь поддержкой разметки представления. Так в нашем тестовом примере фрагмент разметки представления отобразился правильно, чего нельзя сказать о разметке содержания.Решением этой проблемы может служить использование специальных XSLT-стилей "XSLT stylesheets for MathML". Такой подход возможен, так как поддержка XSLT-трансформаций встроена в браузер. Для этого надо скачать набор XSLT-стилей и в первой строчке нашей страницы указать ссылку на заглавный файл mathml. xsl:<? xml-stylesheet type="text/xsl" href="mathml. xsl"? >По соображениям безопасности Mozilla позволяет использовать XSLT-стили расположенные в другом домене просмотра исходного кода MathML с подсветкой выделенного фрагмента. Правда, при использовании разметки содержания и XSLT-стилей мы увидим не исходный код, а результат преобразования.Из других возможностей следует отметить интеграцию с поисковыми системами. При выделенном фрагменте формулы контекстное меню позволяет отправить запрос к поисковой системе.Но пока это задел на будущее, так как пока подобный поиск результатов не дает.2.2 Microsoft Internet ExplorerИспользуемая версия: 6.0.2800.1106 (SP1; Q867801; Q823353; Q833989)Браузер от Microsoft не имеет встроенной поддержки MathML. Для корректного отображения математических формул можно использовать свободно распространяемый плагин MathPlayer.Помимо собственно отображения математической разметки он позволяет быстро копировать MathML-нотацию. Также можно при желании увеличить формулу для лучшей наглядности:Из недостатков следует отметить отсутствие возможности выделить или скопировать фрагмент математического выражения. Также нет возможности (как и в Mozilla) корректно скопировать формулу с окружающим текстом.2.3 OperaИспользуемая версия: 7.54u1 (Build 3918; Platform Win32; System Windows 2000; Java not installed).Этот браузер на данном своего развития этапе не имеет возможностей для корректного отображения разметки MathML.Список использованной литературыДорофеев А.В., Федотов А.М. Электронные публикации в среде Internet и множественность кодировок русского языка // Вычислительные технологии, 1997, т.2, N 3, c.31-44. Олейник О.В., Толкачева Е.М., Федотов А.М. Электронные издания и представление математических текстов на WWW // Вычислительные технологии, 1997, т.2, N 3, c.60-67. Шокин Ю.И., Федотов А.М., Знаменский С.В. Электронные публикации и проблемы множественности кодировок русского языка // Информационные технологии и вычислительные системы, 1997, N 2, c.90-101. Знаменский С.В. Стандартизация русского TeX: утопия или неизбежность // Вычислительные технологии, 1997, т.2, N 3, c.51 - 59. Галактионов В.В. Расширяемый язык разметки XML (Extensible Mark-up Language): промышленный стандарт, определяющий архитектуру программных средств Интернет следующего поколения. Сообщение ОИЯИ, Р10-2000-44, Дубна, 2000. Митюнин В.А. Обзор средств публикации и просмотра математических документов в сети Интернет - http://mathmag. spbu.ru/article/4/ Math on the Web: A Status Report - http://www.dessci.com/ webmath /status/ Including Math Notation in Web Pages - http://mathforum.org/typeseting/ MathML 1.01 - http://www.w3.org/TR/REC-MathML/ MathML 2.0 - http://www.w3.org/TR/MathML2/
Страницы: 1, 2
|
|