build: change ABI versioning to global
[dpdk.git] / doc / guides / contributing / abi_versioning.rst
1 ..  SPDX-License-Identifier: BSD-3-Clause
2     Copyright 2018 The DPDK contributors
3
4 .. _abi_versioning:
5
6 ABI Versioning
7 ==============
8
9 This document details the mechanics of ABI version management in DPDK.
10
11 .. _what_is_soname:
12
13 What is a library's soname?
14 ---------------------------
15
16 System libraries usually adopt the familiar major and minor version naming
17 convention, where major versions (e.g. ``librte_eal 20.x, 21.x``) are presumed
18 to be ABI incompatible with each other and minor versions (e.g. ``librte_eal
19 20.1, 20.2``) are presumed to be ABI compatible. A library's `soname
20 <https://en.wikipedia.org/wiki/Soname>`_. is typically used to provide backward
21 compatibility information about a given library, describing the lowest common
22 denominator ABI supported by the library. The soname or logical name for the
23 library, is typically comprised of the library's name and major version e.g.
24 ``librte_eal.so.20``.
25
26 During an application's build process, a library's soname is noted as a runtime
27 dependency of the application. This information is then used by the `dynamic
28 linker <https://en.wikipedia.org/wiki/Dynamic_linker>`_ when resolving the
29 applications dependencies at runtime, to load a library supporting the correct
30 ABI version. The library loaded at runtime therefore, may be a minor revision
31 supporting the same major ABI version (e.g. ``librte_eal.20.2``), as the library
32 used to link the application (e.g ``librte_eal.20.0``).
33
34 .. _major_abi_versions:
35
36 Major ABI versions
37 ------------------
38
39 An ABI version change to a given library, especially in core libraries such as
40 ``librte_mbuf``, may cause an implicit ripple effect on the ABI of it's
41 consuming libraries, causing ABI breakages. There may however be no explicit
42 reason to bump a dependent library's ABI version, as there may have been no
43 obvious change to the dependent library's API, even though the library's ABI
44 compatibility will have been broken.
45
46 This interdependence of DPDK libraries, means that ABI versioning of libraries
47 is more manageable at a project level, with all project libraries sharing a
48 **single ABI version**. In addition, the need to maintain a stable ABI for some
49 number of releases as described in the section :doc:`abi_policy`, means
50 that ABI version increments need to carefully planned and managed at a project
51 level.
52
53 Major ABI versions are therefore declared typically aligned with an LTS release
54 and is then supported some number of subsequent releases, shared across all
55 libraries. This means that a single project level ABI version, reflected in all
56 individual library's soname, library filenames and associated version maps
57 persists over multiple releases.
58
59 .. code-block:: none
60
61  $ head ./lib/librte_acl/rte_acl_version.map
62  DPDK_20 {
63         global:
64  ...
65
66  $ head ./lib/librte_eal/rte_eal_version.map
67  DPDK_20 {
68         global:
69  ...
70
71 When an ABI change is made between major ABI versions to a given library, a new
72 section is added to that library's version map describing the impending new ABI
73 version, as described in the section :ref:`example_abi_macro_usage`. The
74 library's soname and filename however do not change, e.g. ``libacl.so.20``, as
75 ABI compatibility with the last major ABI version continues to be preserved for
76 that library.
77
78 .. code-block:: none
79
80  $ head ./lib/librte_acl/rte_acl_version.map
81  DPDK_20 {
82         global:
83  ...
84
85  DPDK_21 {
86         global:
87
88  } DPDK_20;
89  ...
90
91  $ head ./lib/librte_eal/rte_eal_version.map
92  DPDK_20 {
93         global:
94  ...
95
96 However when a new ABI version is declared, for example DPDK ``21``, old
97 depreciated functions may be safely removed at this point and the entire old
98 major ABI version removed, see the section :ref:`deprecating_entire_abi` on
99 how this may be done.
100
101 .. code-block:: none
102
103  $ head ./lib/librte_acl/rte_acl_version.map
104  DPDK_21 {
105         global:
106  ...
107
108  $ head ./lib/librte_eal/rte_eal_version.map
109  DPDK_21 {
110         global:
111  ...
112
113 At the same time, the major ABI version is changed atomically across all
114 libraries by incrementing the major version in the ABI_VERSION file. This is
115 done globally for all libraries that declare a stable ABI. For libraries marked
116 as EXPERIMENTAL, their major ABI version is always set to 0.
117
118 Minor ABI versions
119 ~~~~~~~~~~~~~~~~~~
120
121 Each non-LTS release will also increment minor ABI version, to permit multiple
122 DPDK versions being installed alongside each other. Both stable and
123 experimental ABI's are versioned using the global version file that is updated
124 at the start of each release cycle, and are managed at the project level.
125
126 Versioning Macros
127 -----------------
128
129 When a symbol is exported from a library to provide an API, it also provides a
130 calling convention (ABI) that is embodied in its name, return type and
131 arguments. Occasionally that function may need to change to accommodate new
132 functionality or behavior. When that occurs, it is may be required to allow for
133 backward compatibility for a time with older binaries that are dynamically
134 linked to the DPDK.
135
136 To support backward compatibility the ``rte_function_versioning.h``
137 header file provides macros to use when updating exported functions. These
138 macros are used in conjunction with the ``rte_<library>_version.map`` file for
139 a given library to allow multiple versions of a symbol to exist in a shared
140 library so that older binaries need not be immediately recompiled.
141
142 The macros exported are:
143
144 * ``VERSION_SYMBOL(b, e, n)``: Creates a symbol version table entry binding
145   versioned symbol ``b@DPDK_n`` to the internal function ``be``.
146
147 * ``BIND_DEFAULT_SYMBOL(b, e, n)``: Creates a symbol version entry instructing
148   the linker to bind references to symbol ``b`` to the internal symbol
149   ``be``.
150
151 * ``MAP_STATIC_SYMBOL(f, p)``: Declare the prototype ``f``, and map it to the
152   fully qualified function ``p``, so that if a symbol becomes versioned, it
153   can still be mapped back to the public symbol name.
154
155 * ``__vsym``:  Annotation to be used in a declaration of the internal symbol
156   ``be`` to signal that it is being used as an implementation of a particular
157   version of symbol ``b``.
158
159 .. _example_abi_macro_usage:
160
161 Examples of ABI Macro use
162 ~~~~~~~~~~~~~~~~~~~~~~~~~
163
164 Updating a public API
165 _____________________
166
167 Assume we have a function as follows
168
169 .. code-block:: c
170
171  /*
172   * Create an acl context object for apps to
173   * manipulate
174   */
175  struct rte_acl_ctx *
176  rte_acl_create(const struct rte_acl_param *param)
177  {
178         ...
179  }
180
181
182 Assume that struct rte_acl_ctx is a private structure, and that a developer
183 wishes to enhance the acl api so that a debugging flag can be enabled on a
184 per-context basis.  This requires an addition to the structure (which, being
185 private, is safe), but it also requires modifying the code as follows
186
187 .. code-block:: c
188
189  /*
190   * Create an acl context object for apps to
191   * manipulate
192   */
193  struct rte_acl_ctx *
194  rte_acl_create(const struct rte_acl_param *param, int debug)
195  {
196         ...
197  }
198
199
200 Note also that, being a public function, the header file prototype must also be
201 changed, as must all the call sites, to reflect the new ABI footprint.  We will
202 maintain previous ABI versions that are accessible only to previously compiled
203 binaries
204
205 The addition of a parameter to the function is ABI breaking as the function is
206 public, and existing application may use it in its current form. However, the
207 compatibility macros in DPDK allow a developer to use symbol versioning so that
208 multiple functions can be mapped to the same public symbol based on when an
209 application was linked to it. To see how this is done, we start with the
210 requisite libraries version map file. Initially the version map file for the acl
211 library looks like this
212
213 .. code-block:: none
214
215    DPDK_20 {
216         global:
217
218         rte_acl_add_rules;
219         rte_acl_build;
220         rte_acl_classify;
221         rte_acl_classify_alg;
222         rte_acl_classify_scalar;
223         rte_acl_create;
224         rte_acl_dump;
225         rte_acl_find_existing;
226         rte_acl_free;
227         rte_acl_ipv4vlan_add_rules;
228         rte_acl_ipv4vlan_build;
229         rte_acl_list_dump;
230         rte_acl_reset;
231         rte_acl_reset_rules;
232         rte_acl_set_ctx_classify;
233
234         local: *;
235    };
236
237 This file needs to be modified as follows
238
239 .. code-block:: none
240
241    DPDK_20 {
242         global:
243
244         rte_acl_add_rules;
245         rte_acl_build;
246         rte_acl_classify;
247         rte_acl_classify_alg;
248         rte_acl_classify_scalar;
249         rte_acl_create;
250         rte_acl_dump;
251         rte_acl_find_existing;
252         rte_acl_free;
253         rte_acl_ipv4vlan_add_rules;
254         rte_acl_ipv4vlan_build;
255         rte_acl_list_dump;
256         rte_acl_reset;
257         rte_acl_reset_rules;
258         rte_acl_set_ctx_classify;
259
260         local: *;
261    };
262
263    DPDK_21 {
264         global:
265         rte_acl_create;
266
267    } DPDK_20;
268
269 The addition of the new block tells the linker that a new version node is
270 available (DPDK_21), which contains the symbol rte_acl_create, and inherits
271 the symbols from the DPDK_20 node. This list is directly translated into a
272 list of exported symbols when DPDK is compiled as a shared library
273
274 Next, we need to specify in the code which function map to the rte_acl_create
275 symbol at which versions.  First, at the site of the initial symbol definition,
276 we need to update the function so that it is uniquely named, and not in conflict
277 with the public symbol name
278
279 .. code-block:: c
280
281  -struct rte_acl_ctx *
282  -rte_acl_create(const struct rte_acl_param *param)
283  +struct rte_acl_ctx * __vsym
284  +rte_acl_create_v20(const struct rte_acl_param *param)
285  {
286         size_t sz;
287         struct rte_acl_ctx *ctx;
288         ...
289
290 Note that the base name of the symbol was kept intact, as this is conducive to
291 the macros used for versioning symbols and we have annotated the function as an
292 implementation of versioned symbol.  That is our next step, mapping this new
293 symbol name to the initial symbol name at version node 20.  Immediately after
294 the function, we add this line of code
295
296 .. code-block:: c
297
298    VERSION_SYMBOL(rte_acl_create, _v20, 20);
299
300 Remembering to also add the rte_function_versioning.h header to the requisite c
301 file where these changes are being made. The above macro instructs the linker to
302 create a new symbol ``rte_acl_create@DPDK_20``, which matches the symbol created
303 in older builds, but now points to the above newly named function. We have now
304 mapped the original rte_acl_create symbol to the original function (but with a
305 new name).
306
307 Next, we need to create the 21 version of the symbol. We create a new function
308 name, with a different suffix, and implement it appropriately
309
310 .. code-block:: c
311
312    struct rte_acl_ctx * __vsym
313    rte_acl_create_v21(const struct rte_acl_param *param, int debug);
314    {
315         struct rte_acl_ctx *ctx = rte_acl_create_v20(param);
316
317         ctx->debug = debug;
318
319         return ctx;
320    }
321
322 This code serves as our new API call. Its the same as our old call, but adds the
323 new parameter in place. Next we need to map this function to the symbol
324 ``rte_acl_create@DPDK_21``. To do this, we modify the public prototype of the
325 call in the header file, adding the macro there to inform all including
326 applications, that on re-link, the default rte_acl_create symbol should point to
327 this function. Note that we could do this by simply naming the function above
328 rte_acl_create, and the linker would chose the most recent version tag to apply
329 in the version script, but we can also do this in the header file
330
331 .. code-block:: c
332
333    struct rte_acl_ctx *
334    -rte_acl_create(const struct rte_acl_param *param);
335    +rte_acl_create_v21(const struct rte_acl_param *param, int debug);
336    +BIND_DEFAULT_SYMBOL(rte_acl_create, _v21, 21);
337
338 The BIND_DEFAULT_SYMBOL macro explicitly tells applications that include this
339 header, to link to the rte_acl_create_v21 function and apply the DPDK_21
340 version node to it.  This method is more explicit and flexible than just
341 re-implementing the exact symbol name, and allows for other features (such as
342 linking to the old symbol version by default, when the new ABI is to be opt-in
343 for a period.
344
345 One last thing we need to do.  Note that we've taken what was a public symbol,
346 and duplicated it into two uniquely and differently named symbols.  We've then
347 mapped each of those back to the public symbol ``rte_acl_create`` with different
348 version tags.  This only applies to dynamic linking, as static linking has no
349 notion of versioning.  That leaves this code in a position of no longer having a
350 symbol simply named ``rte_acl_create`` and a static build will fail on that
351 missing symbol.
352
353 To correct this, we can simply map a function of our choosing back to the public
354 symbol in the static build with the ``MAP_STATIC_SYMBOL`` macro.  Generally the
355 assumption is that the most recent version of the symbol is the one you want to
356 map.  So, back in the C file where, immediately after ``rte_acl_create_v21`` is
357 defined, we add this
358
359
360 .. code-block:: c
361
362    struct rte_acl_ctx * __vsym
363    rte_acl_create_v21(const struct rte_acl_param *param, int debug)
364    {
365         ...
366    }
367    MAP_STATIC_SYMBOL(struct rte_acl_ctx *rte_acl_create(const struct rte_acl_param *param, int debug), rte_acl_create_v21);
368
369 That tells the compiler that, when building a static library, any calls to the
370 symbol ``rte_acl_create`` should be linked to ``rte_acl_create_v21``
371
372 That's it, on the next shared library rebuild, there will be two versions of
373 rte_acl_create, an old DPDK_20 version, used by previously built applications,
374 and a new DPDK_21 version, used by future built applications.
375
376
377 Deprecating part of a public API
378 ________________________________
379
380 Lets assume that you've done the above update, and in preparation for the next
381 major ABI version you decide you would like to retire the old version of the
382 function. After having gone through the ABI deprecation announcement process,
383 removal is easy. Start by removing the symbol from the requisite version map
384 file:
385
386 .. code-block:: none
387
388    DPDK_20 {
389         global:
390
391         rte_acl_add_rules;
392         rte_acl_build;
393         rte_acl_classify;
394         rte_acl_classify_alg;
395         rte_acl_classify_scalar;
396         rte_acl_dump;
397  -      rte_acl_create
398         rte_acl_find_existing;
399         rte_acl_free;
400         rte_acl_ipv4vlan_add_rules;
401         rte_acl_ipv4vlan_build;
402         rte_acl_list_dump;
403         rte_acl_reset;
404         rte_acl_reset_rules;
405         rte_acl_set_ctx_classify;
406
407         local: *;
408    };
409
410    DPDK_21 {
411         global:
412         rte_acl_create;
413    } DPDK_20;
414
415
416 Next remove the corresponding versioned export.
417
418 .. code-block:: c
419
420  -VERSION_SYMBOL(rte_acl_create, _v20, 20);
421
422
423 Note that the internal function definition could also be removed, but its used
424 in our example by the newer version v21, so we leave it in place and declare it
425 as static. This is a coding style choice.
426
427 .. _deprecating_entire_abi:
428
429 Deprecating an entire ABI version
430 _________________________________
431
432 While removing a symbol from an ABI may be useful, it is more practical to
433 remove an entire version node at once, as is typically done at the declaration
434 of a major ABI version. If a version node completely specifies an API, then
435 removing part of it, typically makes it incomplete. In those cases it is better
436 to remove the entire node.
437
438 To do this, start by modifying the version map file, such that all symbols from
439 the node to be removed are merged into the next node in the map.
440
441 In the case of our map above, it would transform to look as follows
442
443 .. code-block:: none
444
445    DPDK_21 {
446         global:
447
448         rte_acl_add_rules;
449         rte_acl_build;
450         rte_acl_classify;
451         rte_acl_classify_alg;
452         rte_acl_classify_scalar;
453         rte_acl_dump;
454         rte_acl_create
455         rte_acl_find_existing;
456         rte_acl_free;
457         rte_acl_ipv4vlan_add_rules;
458         rte_acl_ipv4vlan_build;
459         rte_acl_list_dump;
460         rte_acl_reset;
461         rte_acl_reset_rules;
462         rte_acl_set_ctx_classify;
463
464         local: *;
465  };
466
467 Then any uses of BIND_DEFAULT_SYMBOL that pointed to the old node should be
468 updated to point to the new version node in any header files for all affected
469 symbols.
470
471 .. code-block:: c
472
473  -BIND_DEFAULT_SYMBOL(rte_acl_create, _v20, 20);
474  +BIND_DEFAULT_SYMBOL(rte_acl_create, _v21, 21);
475
476 Lastly, any VERSION_SYMBOL macros that point to the old version node should be
477 removed, taking care to keep, where need old code in place to support newer
478 versions of the symbol.
479
480
481 Running the ABI Validator
482 -------------------------
483
484 The ``devtools`` directory in the DPDK source tree contains a utility program,
485 ``validate-abi.sh``, for validating the DPDK ABI based on the Linux `ABI
486 Compliance Checker
487 <http://ispras.linuxbase.org/index.php/ABI_compliance_checker>`_.
488
489 This has a dependency on the ``abi-compliance-checker`` and ``and abi-dumper``
490 utilities which can be installed via a package manager. For example::
491
492    sudo yum install abi-compliance-checker
493    sudo yum install abi-dumper
494
495 The syntax of the ``validate-abi.sh`` utility is::
496
497    ./devtools/validate-abi.sh <REV1> <REV2>
498
499 Where ``REV1`` and ``REV2`` are valid gitrevisions(7)
500 https://www.kernel.org/pub/software/scm/git/docs/gitrevisions.html
501 on the local repo.
502
503 For example::
504
505    # Check between the previous and latest commit:
506    ./devtools/validate-abi.sh HEAD~1 HEAD
507
508    # Check on a specific compilation target:
509    ./devtools/validate-abi.sh -t x86_64-native-linux-gcc HEAD~1 HEAD
510
511    # Check between two tags:
512    ./devtools/validate-abi.sh v2.0.0 v2.1.0
513
514    # Check between git master and local topic-branch "vhost-hacking":
515    ./devtools/validate-abi.sh master vhost-hacking
516
517 After the validation script completes (it can take a while since it need to
518 compile both tags) it will create compatibility reports in the
519 ``./abi-check/compat_report`` directory. Listed incompatibilities can be found
520 as follows::
521
522   grep -lr Incompatible abi-check/compat_reports/