第 27 章:扩展 MySQL

目录

27.1. MySQL 内部控件
27.1.1. MySQL 线程
27.1.2. MySQL 测试套件
27.2. 为 MySQL 添加新函数
27.2.1. 自定义函数接口的特性
27.2.2. CREATE FUNCTION/DROP FUNCTION 语法
27.2.3. 添加新的自定义函数
27.2.4. 添加新的固有函数
27.3. 为 MySQL 添加新步骤
27.3.1. 步骤分析
27.3.2. 编写步骤

27.1. MySQL 内部控件

   ;本章包含许多在你处理 MySQL 代码时需要了解的你事情。如果你想投入到 MySQL 的开发中,或想要接触到最新的中间版本的代码,或者就是想了解开发的进度,请参阅2.8.3 节,“从开发源代码树安装”的说明。如果你对 MySQL 的内部插件感兴趣,你也可以订阅我们的内部插件邮件列表。这个列表的流量相对低一些。欲知如何订阅的详情,请参阅1.7.1.1 节,“MySQL 邮件列表”。在 MySQL AB 的所有开发人员都在内部插件列表里, 此外,我们帮助那些正在处理 MySQL 代码的人。请随意使用这个邮件列表来问代码有关的问题,也可用它来发送你想奉献给 MySQL 项目的 补丁!

27.1.1. MySQL 线程

    MySQL 服务器创建如下线程:

  • TCP/IP 连接线程处理所有连接请求,并为每一个连接创建一个新的专用线程来处理认证和 SQL 查询处理。

  • Windows NT 平台上有一个名为管道处理程序 (pipe handler) 的线程,它和名为管道连接请求 (pipe connect requests) 的 TCP/IP 连接线程做同样的工作。

  • 信号线程处理所有的信号,这个线程通常也处理报警和调用 process_alarm() 函数来强制使得空闲时间太长的连接超时。

  • mysqld是与 DUSE_ALARM_THREAD 线程一起编译的,这个专用线程是处理 创建的警报的。这个线程用在一些 sigwait() 函数有问题的系统上,或者用在你想在应用程序中使用 thr_alarm() 代码而不带专用信号处理线程之时。

  • 若想使用 flush_time=val选项,会创建一个专用线程以给定的时间间隔刷新所有表格。

  • 每个连接都有它自己的线程。

  • 每个被使用 INSERT DELAYED 的不同表格都会有自己的线程。

  • 若使用了 master-host, 则会创建一个从属的复制线程从主线程读取并实施更新。

mysqladmin processlist 仅显示连接,INSERT DELAYED,及复制线程

27.1.2. MySQL 测试套件

    ;包含在 Unix 源码和二进制分发版中的测试系统可以让用户和开发人员对 MySQL 代码施行回归测试。这些测试可以在 Unix 上进行,目前它们还不能在原生的 Windows 环境下进行。

     ;当前的测试案例套件不能在 MySQL 中测试所有东西,但是它能发现 SQL 处理代码,OS/library 文件中大多数明显的缺陷,并且在测试复件方面也是非常彻底的。我们的终极目标是对 100% 的代码进行测试。我们欢迎大家给我们的测试套件添加内容。你可能会特别想贡献出那些检查你系统里功能性危机的测试,因为这将确保未来所有发行版的 MySQL 会与你的应用程序一起更好地运行。

27.1.2.1. 运行 MySQL 测试套件

   ;测试系统包括一个测试语言解释器 (mysqltest),一个运行所有测试的外壳脚本 (mysql-test-run),用专用语言编写的测试案例,以及它们的预期结果。在系统上编译好之后,在源代码的 root 下键入make test 或 mysql-test/mysql-test-run。如果安装了一个二进制分发版, cd 到安装 root (如 /usr/local/mysql),然后键入 scripts/mysql-test-run。所有测试应该都通过,假使有没通过的,若是一个 MySQL 里的缺陷,你可以试着找找是因为什么,并且报告这个问题。请参阅27.1.2.3 节,“在 MySQL 测试套件里报告缺陷”

如果你想要运行测试套件的机器上已经运行了一个 mysqld ,只要它不占用 9306 和 9307 端口,就不用停掉它。如果占用了其中的一个,以可以编辑mysql-test-run把主端口和 (或) 从端口号改为其它可用的。.

可使用下面指令运行单个测试案例 mysql-test/mysql-test-run test_name.

若一个测试未通过,你可以用--force 选项来检查运行着的mysql-test-run看是否是别的测试未通过

27.1.2.2. 扩展 MySQL 测试套件

你可以用mysqltest 语言编写你自己的测试案例。不幸地是,我们还没有写完相关方面完整地文档。但是,你可以查看我们现有的测试案例,并将它们作为范例。下面几点将有助于你入手:

  • 测试位于 mysql-test/t/*.test

  • 测试案例包括终止声明,测试案例类似于mysql命令行客户端的输入。 默认的声明是一个被发送到 MySQL 服务器的查询,除非这个声明被识别为内部命令 (如 sleep)。

  • 所有产生结果的查询,例如 SELECT, SHOW, EXPLAIN 等,必须在 @/path/to/result/file之前。那个文件必须包含期望的结果。生成结果文件的一个简单办法是在 mysql-test 目录运行mysqltest -r < t/test-case-name.test ,然后编辑生成的结果文件,如果需要,可将它们调整到想要的输出端。在那种情况下,要小心避免添加或删除任何不可见的字符,确保只改变文本和 (或) 删除行。如果插入一行,要确保插入的区域被一个硬标识隔开,且在行尾有一个硬标识。你可能会想要使用od -c来确保你的文本编辑器在编辑 步骤中没有搞乱任何东西。当你发现一个缺陷而不得不编辑mysqltest -r的输出时,我们真希望你不要编辑它。

  • 为和我们的设置一致,你应该把你的结果文件放在 mysql-test/r 目录,并取名为 test_name.result。如果测试产生不止一个结果,你应该使用诸如 test_name.a.result,test_name.b.result 等这样的名字。

  • 如果声明返回一个错误,你可以在声明的前一行使用--error error-number 来详细说明它。错误号可能是由“,”分开的可能错误号的列表。

  • 如果你正编写一个重复的测试案例,你应该在测试文件的第一行写:source include/master-slave.inc;。用 connection master;和 connection slave;来切换主案例和从案例。如果你需要对一个替换的连接做点什么,对于主连接,用 connection master1;,对于从连接,用 connection slave1;。

  • 如果需要在一个循环里做点什么,可以用些这样的内容:

    let $1=1000;
    while ($ 1)
    {
     # do your queries here
     dec $1;
    }
    
  • 在查询之间休眠,使用sleep命令。此命令支持几分之几秒,所以,例如你想要休眠 1.3 秒,你可以使用sleep 1.3; 命令

  • 对你的测试案例要运行带附加选项的从案例,以命令行方式把它们放在 mysql-test/t/test_name-slave.opt。对于主案例,把它们放在 mysql-test/t/test_name-master.opt。

  • 如果对测试套件有问题,和想要献出一个测试案例,发送邮件信息到 MySQL 内部插件 邮件列表。请参阅1.7.1.1 节,“MySQL 邮件列表”。 虽然这个列表不接受附件,你可以把相关文件通过 ftp 上传到:ftp://ftp.mysql.com/pub/mysql/upload/

27.1.2.3. ;在 MySQL 测试套件中报告缺陷

如果你的 MySQL 的版本没有通过测试套件,你可以采取如下措施:

  • 在尽可能多地找到出错之时的错误之前,不要发送缺陷报告。查找之时,请使用mysqlbug脚本比便我们能获取你的系统和 MySQL 版本信息,参阅1.7.1.3 节 ,“如何报告缺陷或问题

  • 确保包含了mysql-test-run的输出,以及  mysql-test/r 目录下所有.reject文件的内容。

  • 如果测试套件里的测试未通过,用如下命令检查一下看它自己运行时是否通过测试:

    cd mysql-test
    mysql-test-run --local test-name
    

    如果未能通过,你应该用 --with-debug 配置 MySQL 并使用--debug 选项来运行mysql-test-run。如果这样也未能通过,请把追踪文件var/tmp/master.trace 上传到 ftp://ftp.mysql.com/pub/mysql/upload/ 以便我们能检查它。请记得也要包含你系统的完整描述,mysqld 二进制文件的版本,以及你是如何编译它的。

  • 也试着带--force 选项运行一下mysql-test-run ,看是否还有别的测试未通过。

  • 如果你是自己编译的 MySQL,查看我们的手册看看如何在你的平台上编译 MySQL,最好用一个在http://dev.mysql.com/downloads/上我们已经为你编译好的二进制版本。我们所有标准的二进制版本都能通过测试套件的测试!

  • 如果错误是 Result length mismatch 或 Result content mismatch ,这意味测试的输出于期望的输出不匹配,这可能是在 MySQL 或你的mysqld 版本里的缺陷在某些环境下产生稍有不同的结果。

    未通过的测试结果放在和结果文件同主名但扩展名为。reject 的文件里。如果测试案例未通过,你应该对两个文件做 diff 操作。如果你不能发现它们是如何不同,用 od -c 命令检查它们,也检查一下文件长度。

  • 如果测试完全未通过,你应该检查 mysql-test/var/log 目录下的日志文件以获得有关错误的一些提示。

  • 如果你是为调试而编译 MySQL,试一下带--gdb 和 (或)--debug 参数运行mysql-test-run 。请参阅E.1.2 节,“创建跟踪文件”

    如果你没有为调试而编译 MySQL,这应该是你可能去做的。只要带--with-debug 参数运行configure。 请参阅2.8 节,“使用源码分发版安装 MySQL ”

27.2. 为 MySQL 添加新函数

有两个途径来为 MySQL 添加新函数:

  • 你可以通过自行医函数接口 (UDF) 来添加函数。自定义函数被编译为目标文件,然后用 CREATE FUNCTION 和 DROP FUNCTION 声明动态地添入到服务器中及从服务器中移出。参阅27.2.2 节,“CREATE FUNCTION/DROP FUNCTION 语法”

  • 你可以将函数添加为 MySQL 固有 (内建) 函数。固有函数被编译进mysqld服务器中,成为永久可用的。

每种途径都有其优点和缺点:

  • 如果你编写自定义函数,你除了安装服务器本身之外还要安装目标文件。如果将你的函数编译进服务器中,你就不需要这么做了。

  • 你可以给二进制版本的 MySQL 分发版添加 UDF。固有函数需要你去修正源码分发版。.

  • 如果你升级你的 MySQL 分发版,你可以继续使用先前安装了的 UDF, 除非你升级到一个 UDF 接口改变了的新版本。对固有函数而言,每次升级你都必须重复一次修正。

无论你使用哪种方法去添加新函数,它们都可以被 SQL 声明调用,就像 ABS() 或 SOUNDEX() 这样的固有函数一样。

另一个添加函数的方法时创建存储函数。这些函数时用 SQL 声明编写的,而不是编译目标代码。编写存储函数的语法在第 20 章:存储程序和函数 中描述。

下面的小节描述 UDF 接口的特性,给出编写 UDF 的指令,并讨论 MySQL 为防止 UDF 被误用而采取的安全预防措施。

给出源代码的例子来说明如何编写 UDF,看一看 MySQL 源码分发版中提供的 sql/udf_example.cc 文件。

27.2.1. 自定义函数接口的特性

MySQL 自定义函数接口有如下特性和功能:

  • 函数能分÷返回字符串,整数或实数。

  • 你可以定义一次作用于一行的简单函数,或作用于多行的组的集合函数。

  • 提供给函数的信息使得函数可以检查传递给它们的参量的数目和类型。

  • 你可以让 MySQL 在将某参量传递给函数之前强制其为某一类型。

  • 你可以表示函数返回 NULL 或发生错误。

27.2.2. CREATE FUNCTION/DROP FUNCTION 语法

CREATE [AGGREGATE] FUNCTION function_name RETURNS {STRING|INTEGER|REAL}
       SONAME shared_library_name

DROP FUNCTION function_name

一个自定义函数 (UDF) 就是用一个象 ABS() 或 CONCAT() 这样的固有 (内建) 函数一样作用的新函数去扩展 MySQL。

function_name 是 用在 SQL 声明中以备调用的函数名字。RETURNS 子句说明函数返回值的类型。 shared_library_name 是共享目标文件的基本名,共享目标文件含有实现函数的代码。该文件必须位于一个能被你系统的动态连接者搜索的目录里。

你必须有 mysql 数据库的 INSERT 权限才能创建一个函数,你必须有 mysql 数据库的 DELETE 权限才能撤销一个函数。这是因为 CREATE FUNCTION 往记录函数名字,类型和共享名的 mysql.func 系统表里添加了一行,而 DROP FUNCTION 则是从表中删掉这一行。如果你没有这个系统表,你应该运行mysql_fix_privilege_tables脚本来创建一个。请参阅2.10.2 节,“升级授权表”

一个有效的函数是一个用 CREATE FUNCTION 加载且没有用 DROP FUNCTION 移除的函数。每次服务器启动的时候会重新加载所有有效函数,除非你使用--skip-grant-tables 参数启动mysqld。在这种情况下, 将跳过 UDF 的初始化,UDF 不可用。

要了解编写自定义函数的说明,请参阅27.2.3 节,“添加新的自定义函数”。要使得 UDF 机制能够起作用,必须使用 C 或者 C++编写函数,你的系统必须支持动态加载,而且你必须是动态编译的mysqld(非静态)。

一个 AGGREGATE 函数就像一个 MySQL 固有的集合 (总和) 函数一样起作用,比如,SUM 或 COUNT() 函数。要使得 AGGREGATE 起作用,你的 mysql.func 表必须包括一个 type 列。如果你的 mysql.func 表没有这一 列,你应该运行mysql_fix_privilege_tables脚本来创建此 列。

27.2.3. ;添加新的自定义函数

要使得 UDF 机制能够起作用,必须使用 C 或者 C++编写函数,你的系统必须支持动态加载。MySQL 源码分发版包括一个 sql/udf_example.cc 文件,此文件定义了 5 个新函数。可以参考这个文件,看 UDF 是如何调用常规工作。

为了能使用 UDF,你需要动态链接mysqld。不要配置 MySQL 使用--with-mysqld-ldflags=-all-static 参数。如果你想使用一个需要从mysqld 访问符号的 UDF(例如在使用 default_charset_info 的 sql/udf_example.cc 文件中的 metaphone 函数),你必须使用-rdynamic 参数来链接程序 (参阅 man dlopen)。如果你计划使用 UDF,一个经验法则就是,用 with-mysqld-ldflags=-rdynamic 设定 MySQL,除非你有很好的理由不去这么做。

如果你使用的是预编译分发版的 MySQL, 请使用 MySQL-Max,其中含有一个动态链接了的服务器,它可以支持动态加载。

对于每个你想要使用在 SQL 声明中的函数,你应该定义相应的 C (或 C++) 函数。在下面的讨论中,xxx 用来表示范例函数的名字,为了区分使用 SQL 还是 C/C++,xxx()(上标) 表示 SQL 函数调用,xxx()(下标) 表示 C/C++函数调用。

你为 xxx() 编写来实现接口的 C/C++ 函数如下:

  • xxx() (必有)

    主函数。 这是函数结果被计算的地方。SQL 函数数据类型与 C/C++函数返回类型的对应关系如下:

    SQL 类型C/C++ 类型
    STRINGchar *
    INTEGERlong long
    REALdouble
  • xxx_init() (可选)

    对 xxx() 的初始化函数。它可以被用来:

    • 检查传递给 xxx() 的参量数目。

    • 检查参量是否为必需的类型,或者,除此之外,在主函数被调用的时候告诉 MySQL 将参量强制为想要的类型。

    • 分配主函数需要的内存。

    • 指定结果的最大长度。

    • 指定 (对于 REAL 函数) 小数的最多位数。

    • 指定结果是否可以为 NULL。

  • xxx_deinit() (可选)

    对 xxx() 的去初始化函数。它释放初始化函数分配的内存。

当 SQL 声明调用 XXX() 时,MySQL 调用初始化函数 xxx_init(),让它执行必要的设置,比如,检查 参量或分配内存。如果 xxx_init() 返回一个错误,SQL 声明会退出并给出错误信息,而主函数和去初始化函数并没有被调用。 否则,主函数 xxx() 对每一行都被调用一次。所有行都处理完之后,调用去初始化函数 xxx_deinit() 执行必要的清除。

对于象 SUM() 一样工作的集合函数,你也必须提供如下的函数:

  • xxx_clear() (在 5.1 节中必须)

    对一个新组重置当前集合值为初试集合值,但不插入任何参量。

  • xxx_add() (必须)

    添加参量到当前集合值。

MySQL 按下列操作来处理集合 UDF:

  1. 调用 xxx_init() 让集合函数分配它需要用来存储结果的内存。

  2. 按照 GROUP BY 表达式来排序表。

  3. 为每个新组中的第一行调用 xxx_clear() 函数。

  4. 为属于同组的每一个新行调用 xxx_add() 函数。

  5. 当组改变时或每组的最后一行被处理完之后,调用 xxx() 来获取集合结果。

  6. 重复,以上 3-步直到所有行被处理完。

  7. 调用 xxx_deinit() 函数去释放 UDF 分配的内存。.

所有函数必须时线程安全的,这不仅对主函数,对初始化和去初始化函数也一样,也包括集合函数要求的附加函数。这个要求的一个结果就是,你不能分配任何变化的全局或静态变量。如果你需要内存,你可以在 xxx_init() 函数分配内存,然后在 xxx_deinit() 函数释放掉。

27.2.3.1. UDF 对简单函数的调用顺序

下面介绍创建简单 UDF 时需要定义的不同函数。27.2.3 节,“添加新的自定义函数”中介绍了 MySQL 调用这些函数的顺序。

如本节所示,应该说明主函数 xxx()。注意返回值和参数会有所不同,这取决于你说明的 SQL 函数 xxx() 在 CREATE FUNCTION 声明中返回的是 STRING,INTEGER 类型还是 REAL 类型示:

对于 STRING 型函数:

char *xxx(UDF_INIT *initid, UDF_ARGS *args,
          char *result, unsigned long *length,
          char *is_null, char *error);

对于 INTEGER 型函数:

long long xxx(UDF_INIT *initid, UDF_ARGS *args,
              char *is_null, char *error);

对于 REAL 型函数:

double xxx(UDF_INIT *initid, UDF_ARGS *args,
              char *is_null, char *error);

初始化和去初始化函数如下说明:

my_bool xxx_init(UDF_INIT *initid, UDF_ARGS *args, char *message);

void xxx_deinit(UDF_INIT *initid);

initid 参数被传递给所有的三个函数。它指向一个 UDF_INIT 结构,这个结构被用来在函数之间交换信息。UDF_INIT 结构项跟随着。初始化函数应该给任何它想要改变的项赋值。(要使用项的默认值,就让它不被改变)

  • my_bool maybe_null

    如果 xxx() 能返回 NULL,xxx_init() 应 maybe_null 为 1 。如果任一参量被说明了 maybe_null 值,其 默认值是 1 。

  • unsigned int decimals

    小数位数。默认值是传到主函数的参量里小数的最大位数。(例如,如果函数传递 1.34, 1.345, 和 1.3,那么默认值为,因为 1.345 有 3 位小数。

  • unsigned int max_length

    结果的最大长度。max_length 的默认值因函数的结果类型而异。对字符串函数,默认值是最长参量的长度。对整型函数,默认是 21 位。对实型函数,默认是 13 再加上 initid->decimals 指示的小数位数。(对数字函数,长度包含正负号或者小数点符)。

    如果想返回团值,你可以把 max_length 设为从 65KB 到 16MB。这个内存不会被分配,但是如果有临时数据需要存储,这个设置了的值被用来决定使用哪种 列的类型。

  • char *ptr

    函数可以用作本身目的的指针。比如,函数可以用 initid->ptr 来在分配了的内存内部通讯。 xxx_init() 应该分配内存,并指派给这个指针:

    initid->ptr = allocated_memory;
    

    在 xxx() 和 xxx_deinit() 中,借用 initid->ptr 来使用或分配内存。

27.2.3.2. UDF 对集合函数的调用顺序

本节介绍创建集合 UDF 之时需要定义的不同函数。27.2.3 节,“添加新的自定义函数” 介绍了 MySQL 调用这些函数的顺序。

  • xxx_reset()

    当 MySQL 在一个新组中发现第一行时调用这个函数。它对这个组重置任何内部总和变量,然后使用给定的 UDF_ARGS 参量作为内部总和值的第一个值。如下说明 xxx_reset() 函数:

    char *xxx_reset(UDF_INIT *initid, UDF_ARGS *args,
                    char *is_null, char *error);
    

     ;在 MySQL5.1 版中 UDF 接口不需要或不使用 xxx_reset() 函数,而是使用 xxx_clear() 函数作为替代。但是如果你想让 UDF 也能在老版本的服务器上运行,你也可以定义 xxx_reset() 和 xxx_clear() 函数。(如果你使用了这两个函数,xxx_reset() 函数在很多情况下可以通过调用函数来内部实现,即调用 xxx_clear() 函数重置所有变量,然后添加 UDF_ARGS 参量作为组的第一个值。)

  • xxx_clear()

    当 MySQL 需要重置总和结果时调用此函数。对每一个新组,在开始之时调用它,但是它也可以被调用来为一个没有匹配行在其中的查询重置值。如下说明 xxx_clear():

    char *xxx_clear(UDF_INIT *initid, char *is_null, char *error);
    

    在调用 xxx_clear() 之前 is_null 被设置指向 CHAR(0) 。

    如果发生错误,你可以存储一个值在 error 参量指向的变量中。error 指向一单字节变量,而不是一个字符串缓冲区。

    xxx_clear() 是 MySQL 5.1 必须的。

  • xxx_add()

    为同组除了第一行之外,所有的行调用这个函数。你应该用它在 UDF_ARGS 参量中向内部总和变量加值。.

    char *xxx_add(UDF_INIT *initid, UDF_ARGS *args,
                  char *is_null, char *error);
    

对集合 UDF 而言 xxx() 函数应该用与非集合 UDF 一样的方法来说明。请参阅27.2.3.1 节,“UDF 调用简单函数的顺序”

对一个集合 UDF,MySQL 在组内所有行被处理之后调用 xxx() 函数。这里你应该一般不会接触到它的 UDF_ARGS 参量,但是取而代之地根据内部总和变量返回给你值。

在 xxx() 中处理的返回值应该用与对非集合 UDF 一样的方法来操作。请参阅27.2.3.4 节,“UDF 返回值和错误处理”

xxx_reset() 和 xxx_add() 函数用与非集合 UDF 一样的方法来处理它们的 UDF_ARGS 参量。请参阅27.2.3.3 节,“UDF 参量处理”

到 is_null 和 error 的指针 参量和所有到 xxx_reset(), xxx_clear(), xxx_add() 和 xxx() 调用一样。你可以用这个来提醒你获取一个错误或无论 xxx() 是否返回 NULL 的一个结果。你不能把一个字符串存到*error!error 指向单字节变量而不是字符串缓冲区。

*is_null 对每一个组都重置 (调用 xxx_clear() 前), *error 从不重置。

如果 xxx() 返回时,*is_null 或 *error 被设置,MySQL 返回 NULL 作为组函数的结果。

27.2.3.3. UDF 参量处理

args 参数指向列着结构元的 UDF_ARGS 结构:

  • unsigned int arg_count

    参量个数。如果你需要你的函数带着某个数目的参量被调用,在初始化函数检查这个值,例如:

    if (args->arg_count != 2)
    {
        strcpy(message,"XXX() requires two arguments");
        return 1;
    }
    
  • enum Item_result *arg_type

    一个指针,对每个参量指向包含类型的一个数列。可能的类型值是 STRING_RESULT, INT_RESULT 和 REAL_RESULT。

    要确信一个参量是给定类型的,并且如果不是的话就返回一个错误,请检查初始化函数中的 arg_type 数列。比如:

    if (args->arg_type[0] != STRING_RESULT ||
        args->arg_type[1] != INT_RESULT)
    {
        strcpy(message,"XXX() requires a string and an integer");
        return 1;
    }
    

    要求你函数的参量是某一类型的另一方法是,使用初始化函数设置 arg_type 元素为你想要的类型。对所有对 xxx() 的调用而言,这会导致 MySQL 强制参量为这些类型。比如,要指定投两个参量强制成字符串和整数,在 xxx_init() 中分别:

    args->arg_type[0] = STRING_RESULT;
    args->arg_type[1] = INT_RESULT;
    
  • char **args

    args->args 与初始化函数做有关传到你函数的参量的一般情况做通讯。对于常参量 i,args->args[i] 指向参量值。(看下面的说明了解如何妥善地访问这个值)。对非-常参量,args->args[i] 为 0。一个常参量为仅使用参量的表达式,如 3 或 4*7-2 或 SIN(3.14)。一个非常 参量是一个行与行不同的表达式,如,列名或带非-常参量调用的函数。

    对主函数的每次调用,args->args 包含为每个当前处理的行传递的实际参量。

    如下使用参量 i 的函数:

    • 给一个 STRING_RESULT 型的参量作为一个字符串加一个长度,可以允许所有二进制数或任意长度的数处理。字符串内容作为 args->args[i] 而字符串长度为 args->lengths[i]。你不能采用 null 结尾的字符串。

    • 对一个 INT_RESULT 型的参量,你必须转换 args->args[i] 为一个 long long 值:

      long long int_val;
      int_val = *((long long*) args->args[i]);
      
    • 对一个 REAL_RESULT 型参量,你必须转换 args->args[i] 为一个双精度值:

      double    real_val;
      real_val = *((double*) args->args[i]);
      
  • unsigned long *lengths

    对初始化函数,lengths 数列表示对每个参量的最大字符串长度。你不要改变它。对主函数的每次调用,lengths 包含了对当前处理行传递的任何字符串 参量的实际长度。对于 INT_RESULT 或 REAL_RESULT 类型的参量,lengths 仍包含参量的最大长度 (对初始化函数)。

27.2.3.4. UDF 返回值和错误处理

如果没有错误发生,初始化函数应该返回 0,否则就返回 1。如果有错误发生,xxx_init() 应该在 message 参数存储一个以 null 结尾的错误消息。该消息被返回给客户端。消息缓冲区是 MYSQL_ERRMSG_SIZE 字符长度,但你应该试着把消息保持在少于 80 个字符,以便它能适合标准终端屏幕的宽度。

对于 long long 和 double 类型的函数,主函数 xxx() 的返回返回值是函数值。字符函数返回一个指向结果的指针,并且设置 *result 和 *length  为返回值的内容和长度。例如:

memcpy(result, "result string", 13);
*length = 13;

被传给 xxx() 函数的结果缓冲区是 255 字节长。如果你的结果适合这个长度,你就不需要担心对结果的内存分配。

如果字符串函数需要返回一个超过 255 字节的字符串,你必须用 malloc() 在你的 xxx_init() 函数或者 xxx() 函数里为字符串分配空间,并且在 xxx_deinit() 函数里释放此空间。你可以将已分配内存存储在 UDF_INIT ;结构里的 ptr ;位置以备将来 xxx() 调用。请参阅27.2.3.1 节,“UDF 对简单函数的调用顺序”

要在主函数中指明一个 NULL 的返回值,设置 *is_null 为 1 :

*is_null = 1;

要在主函数中指明错误返回,设置 *error 为 1 :

*error = 1;

如果 xxx() 对任意行设置 *error 为 1  ,对于任何 XXX() 被调用的语句处理的当前行和随后的任意行,该函数值为 NULL (甚至都不为随后的行调用 xxx())。

27.2.3.5. 编译和安装自定义函数

实现 UDF 的文件必须在运行服务器的主机上编译和安装。这个步骤在下面介绍,以包含在 MySQL 源码分发版里的 UDF 文件 sql/udf_example.cc 为例。

紧接着下面的指令是对 Unix 的,对 Windows 的指令在本节稍后给出。

 udf_example.cc 文件包含下列函数:

  • metaphon() 返回字符串参量的一个变音位 (metaphon) 字符串,这有点象一个探测法 (soundex) 字符串,但是它英语更协调。

  • myfunc_double() 返回在其参量中所有字符的 ASCII 值的和,除以其 参量长度之和。

  • myfunc_int() 返回其参量长度之和。

  • sequence([const int]) 返回一个序列,从给定数开始,若没有给定数则从 1 开始。

  • lookup() 返回对应主机名的 IP 数。

  • reverse_lookup() 返回对应一个 IP 数的主机名。函数可以带'xxx.xxx.xxx.xxx'形式的一个单字符串 参量调用,要么带 4 个数字调用。

一个可动态加载的文件应使用如下这样的命令编译为一个可共享的对象文件:

shell> gcc -shared -o udf_example.so udf_example.cc

如果你使用gcc,你应该能用一个更简单的命令创建udf_example.so :

shell> make udf_example.so

通过运行 MySQL 源码树下 sql 里的如下命令,你可以容易地为你的系统决定正确的编译器选项:

shell> make udf_example.o

你应该运行一个类似于make所显示那样的编译命令,除了要在行尾附近删除-c 选项,并在行尾加上加上 -o udf_example.so。(在某些系统上,你可能需要在命令行留着-c 选项)。

编译好一个包含有 UDF 的共享目标后,你必须安装它并通知 MySQL。从 udf_example.cc 编译一个共享目标文件产生一个名字类似于 udf_example.so 的文件 (确切名字可能因平台而异)。把这个文件复制到 /usr/lib 这样被你系统的动态 (运行时) 链接器搜索到的目录下,或者 把你放共享目标文件的目录添加到链接器配置文件 (如,/etc/ld.so.conf )。

动态链接器的名字时系统特定的 (如,在 FreeBSD 上是ld-elf.so.1 ,在Linux 上是 ld.so,在 Mac OS X 上是dyld )。查看一下你系统的文档,看看链接器的名字是什么及如何配置链接器。

在许多系统上,你也可以设置环境变量 LD_LIBRARY 或 LD_LIBRARY_PATH 指向你放 UDF 的目录。dlopen 手册会告诉你,在你系统上用哪个变量名。你可以在mysql.servermysqld_safe 启动脚本里设置这个然后重启 mysqld

在一些系统上,配置动态链接器的ldconfig不能识别不是以lib做名字开头的共享目标。在这种情况下,你应该把udf_example.so 改名为 libudf_example.so。

在 Windows 系统上,你可以通过下列步骤编译自定义函数:

  1. 你需要获得 BitKeeper source repository for MySQL 5.1。 请参阅 2.8.3 节,“从开发源树安装”

  2. 在源数据仓里的 VC++Files/examples/udf_example 目录下,有名为 udf_example.def, udf_example.dsp,和 udf_example.dsw ;的文件。

  3. 在数据仓的 sql 目录下,复制 udf_example.cc 文件到 VC++Files/examples/udf_example 目录,并改其名为 udf_example.cpp。

  4. Visual Studio VC++用打开 udf_example.dsw 文件,用它把 UDF 编译为一个一般项目。

共享目标文件安装完以后,为新函数信息修改 mysqld ,做如下声明:

mysql> CREATE FUNCTION metaphon RETURNS STRING SONAME 'udf_example.so';
mysql> CREATE FUNCTION myfunc_double RETURNS REAL SONAME 'udf_example.so';
mysql> CREATE FUNCTION myfunc_int RETURNS INTEGER SONAME 'udf_example.so';
mysql> CREATE FUNCTION lookup RETURNS STRING SONAME 'udf_example.so';
mysql> CREATE FUNCTION reverse_lookup
    ->        RETURNS STRING SONAME 'udf_example.so';
mysql> CREATE AGGREGATE FUNCTION avgcost
    ->        RETURNS REAL SONAME 'udf_example.so';

可以使用 DROP FUNCTION 删除函数:

mysql> DROP FUNCTION metaphon;
mysql> DROP FUNCTION myfunc_double;
mysql> DROP FUNCTION myfunc_int;
mysql> DROP FUNCTION lookup;
mysql> DROP FUNCTION reverse_lookup;
mysql> DROP FUNCTION avgcost;

CREATE FUNCTION 和 DROP FUNCTION 声明更新 mysql 数据库中的 func 系统表。函数名,类型和共享库名存进表中。你必须有 mysql 数据库的 INSERT 和 DELETE 权限来创建和移除函数。

你不能使用 CREATE FUNCTION 去田间一个先前已经被创建的函数。如果你需要重新安装一个函数,你可以用 DROP FUNCTION 移除它,然后再用 CREATE FUNCTION 重新安装它。你可能会需要这么做,比如你重新编译新版本的函数以便mysqld得到这个新版本。不然,服务器还继续使用旧的版本。

一个有效程序是已被 CREATE FUNCTION 加载且没有被 DROP FUNCTION 移除的函数。所有有效函数在每次服务器启动时重新加载,除非你使用--skip-grant-tables 选项来启动mysqld。这种情况下,UDF 的初始化将被跳过,UDF 不可用。

27.2.3.6. 自定义函数安全预防措施

MySQL 采取下列措施来防止误用自定义函数。

你必须有 INSERT 权限才能使用 CREATE FUNCTION 及有 DELETE 权限才能使用 DROP FUNCTION。这是很必要的,因为这些声明在 mysql.func 表里添加合删除行。

除了对应主 xxx() 函数的 xxx 符号,UDF 应该至少定义一个符号。这些辅助符号对应 xxx_init(), xxx_deinit(), xxx_reset(), xxx_clear() 和 xxx_add() 函数。mysqld 也支持一个控制仅有一个 xxx 符号的 UDF 是否被加载的--allow-suspicious-udfs。这个选项 默认是关,以防止从共享目标文件而不是从这些已包含的合法 UDF 加载的企图。如果你有仅含 xxx 符号的老版本 UDF,以及不能重编译来包含辅助符号的老版本 UDF,那就有必要选--allow-suspicious-udfs 选项。否则,你应该避免打开这个选项。

UDF 目标文件不能放在任意目录。它们必须位于动态链接器被配置来搜索到的一些系统目录。为强制执行这个限制并防止指定被动态链接器搜索到的目录之外的路径,MySQL 在加载函数的时候检查在 CREATE FUNCTION 中指定的共享目标文件名,以及存在 mysql.func 表中的文件的路径分隔符。这防止通过直接操作 mysql.func 表指定非法路径名。有关 UDF 和运行时链接器,请参阅27.2.3.5 节,“编译和安装自定义函数”

27.2.4. 添加新的固有函数

下面介绍添加新固有函数的步骤。要注意你不能添加固有函数到二进制分发版里,因为这个步骤包含修改 MySQL 源代码。你必须从源码分发版自己编译 MySQL。另外要注意,如果你把 MySQL 移植到另一个版本 (比如新版本放出来的时候),你需要用新版本重复这个添加 步骤。

采取下列步骤来添加 MySQL 新的固有函数:

  1. 在定义函数名的 lex.h 文件中的 sql_functions[] 数列里添加一行。

  2. 如果函数原型是简单的 (只有零个,一个,二个或三个参量),你应该在 lex.h 中指定 SYM(FUNC_ARGN) (其中N 是参量的个数) 作为 sql_functions[] 数列中的第二个 参量,并添加一个在 item_create.cc 中创建函数目标的函数。可以看看 "ABS" 和 create_funcs_abs() 作为举例说明。

    如果函数原型是复杂的 (举例,如果函数有多种参量),你应该给 sql_yacc.yy 添加两行。一行表示yacc应该定义的预处理程序记号,(这应该在文件的开始添加)。然后定义函数 参数,并添加一个带这些参数的项到simple_expr分析规则中。举一个例子,你可以检查 sql_yacc.yy 中所有出现的 ATAN 看看这个定义是什么样子的。

  3. 在 item_func.h 中说明一个继承自 Item_num_func 还是 Item_str_func 的类,取决于你的函数是返回一个数还是一个字符串。

  4. 在 item_func.cc 中是否添加下列说明之一,取决于你是定义一个数字函数还是字符函数:

    double   Item_func_newname::val()
    longlong Item_func_newname::val_int()
    String  *Item_func_newname::Str(String *str)
    

    如果你从任何标准项继承了你的目标 (类似于 Item_num_func),你或许只要定义这些函数中的一个,然后让父目标照管别的函数。比如,Item_str_func 类定义了一个 val() 函数,它这个函数对::str() 返回的值进行 atof() 操作。

  5. 你或许也定义了下列目标函数:

    void Item_func_newname::fix_length_and_dec()
    

    这个函数至少应该计算基于给定参量的 max_length。 max_length 是函数可能返回字符的最大个数。如果主函数不能返回 NULL 值,这个函数也应该设置 maybe_null = 0。函数可以通过检查函数的 maybe_null 值来检查是否有函数 参量能返回 NULL 值。你可以看一下 Item_func_mod::fix_length_and_dec 作为典型的例子来说明这个问题。

所有函数都必须是线程安全的,换句话说就是,如果没有互斥体保护,不要在函数中使用任何全局或静态变量。

如果你想要从函数::val(), ::val_int() 或::str() 返回 NULL,你应该设 null_value 为 1,并返回 0。

对于目标函数 ::str() 有一些需要而外考虑之处::

  • 字符串参量*str 提供一个字符串缓冲可以用来保持结果 (更多关于字符串类型的信息请参阅 sql_string.h 文件)。 

  • 如果结果为 NULL,::str() 函数应该返回保持这个结果的字符串或 (char*) 0。

  • 除非有绝对地需要,所有当前的字符串函数要避免分配内存!

27.3. ;为 MySQL 添加新步骤

在 MySQL 中,你可以用 C++定义一个步骤,在一个查询被发送到客户端之前访问和修改其中的数据。修改可以一行接一行地做,或者按照级别成组 (GROUP) 地做。

我们创建一个范例步骤来演示你可以做的。

此外,我们推荐你看一下 mylua。通过它你可以用  LUA 语言把运行时里的一个 步骤加载到mysqld中。

27.3.1. 步骤分析

analyse([max_elements,[max_memory]])

这个步骤在 sql/sql_analyse.cc 定义,这个步骤检查你查询的结果,并且返回对此结果的一个分析:

  • max_elements (默认值 256) 是 analyse 注意到每 列不同值的最高数目。analyse 使用此 参数来检查是否最优化的列的类型是 ENUM 类型。

  • max_memory (默认值 8192) 是 analyse 在查找所有不同值时分配给每 列的最大内存数。i

SELECT ... FROM ... WHERE ... PROCEDURE ANALYSE([max_elements,[max_memory]])

27.3.2. ;编写步骤

当前来说,相关的文档只有源码。

检查下列文件可以获得关于步骤的所有信息:

  • sql/sql_analyse.cc

  • sql/procedure.h

  • sql/procedure.cc

  • sql/sql_select.cc


这是 MySQL 参考手册的翻译版本,关于 MySQL 参考手册,请访问dev.mysql.com。 原始参考手册为英文版,与英文版参考手册相比,本翻译版可能不是最新的。