XML 语法规则

  • 定义和使用

    XML 的语法规则非常简单,逻辑性强;这些规则很容易学习,也很容易使用。
    XML 文档必须包含一个根元素,该元素是所有其他元素的父元素:
    <root>
       <child>
           <subchild>.....</subchild>
       </child>
    </root>
    
    
    在本例中<note>是根元素:
    <?xml version="1.0" encoding="UTF-8"?>
    <note>
          <to>Tove</to>
          <from>Jani</from>
          <heading>Reminder</heading>
          <body>这个周末别忘了我!</body>
    </note>
    
    
  • XML Prolog

    这一行称为 XML prolog:
    <?xml version="1.0" encoding="UTF-8"?>
    
    
    XML prolog 是可选的。如果它存在,它必须在文档中位于第一位。
    XML 文档可以包含国际字符,如挪威语或法语。
    为了避免错误,应该指定使用的编码,或者将 XML 文件保存为 UTF-8
    UTF-8XML 文档的默认字符编码。
    字符编码可以在我们的字符集教程中学习。
    UTF-8 也是 HTML5、CSS、JavaScript、PHP和SQL的默认编码。
  • XML元素必须要有结束标记

    XML 中,省略结束标记是非法的;所有元素都必须有结束标记:
    <p>这个一段落</p>
    <br />
    
    
    注意:XML prolog 没有结束标记!这不是错误。prolog 不是 XML 文档的一部分。
    XML 标记区分大小写。标签<Letter>与标签<letter>不同。
    打开和关闭标签必须用统一书写:
    <message>这个一消息</message>
    
    
    在HTML中,您可能会看到嵌套不正确的元素:
    <b><i>此文本为粗体和斜体</b></i>
    
    
    XML 中,所有元素必须正确嵌套在彼此之间:
    <b><i>此文本为粗体和斜体</i></b>
    
    
    在上面的例子中,“正确嵌套”仅仅意味着由于<i>元素在<b>元素中打开,它必须在<b>元素中关闭。
  • 引用XML属性值

    XML 元素在名称/值对中可以有属性,就像在 HTML 中一样。
    XML 中,必须始终引用属性值:
    <note date="10/04/2020">
     <to>Tove</to>
     <from>Jani</from>
    </note>
    
    
  • 引用XML属性值

    有些字符在 XML 中有特殊的含义。
    如果在 XML 元素中放置类似“<”的字符,它将生成错误,因为解析器将其解释为新元素的开始。
    这将生成一个 XML 错误:
    <message>salary < 1000</message>
    
    
    若要避免此错误,请将“<”字符替换为实体引用:
    <message>salary &lt; 1000</message>
    
    
    XML 中有5个预定义的HTML实体引用:
    &lt; < 小于
    &gt; > 大于
    &amp; & 与号 
    &apos; ' 撇号
    &quot; " 引号
    XML 中,只有<和&是严格非法的,但是用&gt;替换>也是一个好习惯。
  • XML注释

    XML 编写注释的语法与 HTML 类似:
    <!-- 这是一个注释 -->
    
    
    注释中间不允许有两个破折号:
    <!-- 这是一个无效的 -- 注释 -->
    
    
  • 空白以XML格式保留

    XML 不截断多个空格(HTML将多个空格截断为一个空格):
    XML: Hello           Tove
    HTML: Hello Tove
  • XML将新行存储为LF

    • Windows 应用程序将新行存储为:回车和换行(CR+LF)。
    • Unix 和 MacOSX 使用 LF。
    • 旧的 Mac 系统使用 CR。
    • XML 将新行存储为 LF。
    符合上述语法规则的 XML 文档称为 “格式良好” 的 XML 文档。