change parse api
[protos/libecoli.git] / lib / ecoli_node_sh_lex.c
1 /*
2  * Copyright (c) 2016, Olivier MATZ <zer0@droids-corp.org>
3  *
4  * Redistribution and use in source and binary forms, with or without
5  * modification, are permitted provided that the following conditions are met:
6  *
7  *     * Redistributions of source code must retain the above copyright
8  *       notice, this list of conditions and the following disclaimer.
9  *     * Redistributions in binary form must reproduce the above copyright
10  *       notice, this list of conditions and the following disclaimer in the
11  *       documentation and/or other materials provided with the distribution.
12  *     * Neither the name of the University of California, Berkeley nor the
13  *       names of its contributors may be used to endorse or promote products
14  *       derived from this software without specific prior written permission.
15  *
16  * THIS SOFTWARE IS PROVIDED BY THE REGENTS AND CONTRIBUTORS ``AS IS'' AND ANY
17  * EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED
18  * WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE ARE
19  * DISCLAIMED. IN NO EVENT SHALL THE REGENTS AND CONTRIBUTORS BE LIABLE FOR ANY
20  * DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES
21  * (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES;
22  * LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND
23  * ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT
24  * (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE OF THIS
25  * SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
26  */
27
28 #include <stdio.h>
29 #include <stdlib.h>
30 #include <string.h>
31 #include <assert.h>
32 #include <stdarg.h>
33 #include <ctype.h>
34 #include <errno.h>
35
36 #include <ecoli_malloc.h>
37 #include <ecoli_log.h>
38 #include <ecoli_test.h>
39 #include <ecoli_strvec.h>
40 #include <ecoli_node.h>
41 #include <ecoli_parsed.h>
42 #include <ecoli_completed.h>
43 #include <ecoli_node_seq.h>
44 #include <ecoli_node_str.h>
45 #include <ecoli_node_option.h>
46 #include <ecoli_node_sh_lex.h>
47
48 struct ec_node_sh_lex {
49         struct ec_node gen;
50         struct ec_node *child;
51 };
52
53 static size_t eat_spaces(const char *str)
54 {
55         size_t i = 0;
56
57         /* skip spaces */
58         while (isblank(str[i]))
59                 i++;
60
61         return i;
62 }
63
64 /*
65  * Allocate a new string which is a copy of the input string with quotes
66  * removed. If quotes are not closed properly, set missing_quote to the
67  * missing quote char.
68  */
69 static char *unquote_str(const char *str, size_t n, int allow_missing_quote,
70         char *missing_quote)
71 {
72         unsigned s = 1, d = 0;
73         char quote = str[0];
74         char *dst;
75         int closed = 0;
76
77         dst = ec_malloc(n);
78         if (dst == NULL) {
79                 errno = ENOMEM;
80                 return NULL;
81         }
82
83         /* copy string and remove quotes */
84         while (s < n && d < n && str[s] != '\0') {
85                 if (str[s] == '\\' && str[s+1] == quote) {
86                         dst[d++] = quote;
87                         s += 2;
88                         continue;
89                 }
90                 if (str[s] == '\\' && str[s+1] == '\\') {
91                         dst[d++] = '\\';
92                         s += 2;
93                         continue;
94                 }
95                 if (str[s] == quote) {
96                         s++;
97                         closed = 1;
98                         break;
99                 }
100                 dst[d++] = str[s++];
101         }
102
103         /* not enough room in dst buffer (should not happen) */
104         if (d >= n) {
105                 ec_free(dst);
106                 errno = EMSGSIZE;
107                 return NULL;
108         }
109
110         /* quote not closed */
111         if (closed == 0) {
112                 if (missing_quote != NULL)
113                         *missing_quote = str[0];
114                 if (allow_missing_quote == 0) {
115                         ec_free(dst);
116                         errno = EINVAL;
117                         return NULL;
118                 }
119         }
120         dst[d++] = '\0';
121
122         return dst;
123 }
124
125 static size_t eat_quoted_str(const char *str)
126 {
127         size_t i = 0;
128         char quote = str[0];
129
130         while (str[i] != '\0') {
131                 if (str[i] != '\\' && str[i+1] == quote)
132                         return i + 2;
133                 i++;
134         }
135
136         /* unclosed quote, will be detected later */
137         return i;
138 }
139
140 static size_t eat_str(const char *str)
141 {
142         size_t i = 0;
143
144         /* skip spaces */
145         while (!isblank(str[i]) && str[i] != '\0')
146                 i++;
147
148         return i;
149 }
150
151 static struct ec_strvec *tokenize(const char *str, int completion,
152         int allow_missing_quote, char *missing_quote)
153 {
154         struct ec_strvec *strvec = NULL;
155         size_t off = 0, len, suboff, sublen;
156         char *word = NULL, *concat = NULL, *tmp;
157         int last_is_space = 1;
158
159 //      printf("str=%s\n", str);
160
161         strvec = ec_strvec();
162         if (strvec == NULL)
163                 goto fail;
164
165         while (str[off] != '\0') {
166                 len = eat_spaces(&str[off]);
167                 if (len > 0)
168                         last_is_space = 1;
169 //              printf("space=%zd\n", len);
170                 off += len;
171
172                 len = 0;
173                 suboff = off;
174                 while (str[suboff] != '\0') {
175                         last_is_space = 0;
176                         if (str[suboff] == '"' || str[suboff] == '\'') {
177                                 sublen = eat_quoted_str(&str[suboff]);
178 //                              printf("sublen=%zd\n", sublen);
179                                 word = unquote_str(&str[suboff], sublen,
180                                         allow_missing_quote, missing_quote);
181                         } else {
182                                 sublen = eat_str(&str[suboff]);
183 //                              printf("sublen=%zd\n", sublen);
184                                 if (sublen == 0)
185                                         break;
186                                 word = ec_strndup(&str[suboff], sublen);
187                         }
188
189                         if (word == NULL)
190                                 goto fail;
191 //                      printf("word=%s\n", word);
192
193                         len += sublen;
194                         suboff += sublen;
195
196                         if (concat == NULL) {
197                                 concat = word;
198                                 word = NULL;
199                         } else {
200                                 tmp = ec_realloc(concat, len + 1);
201                                 if (tmp == NULL)
202                                         goto fail;
203                                 concat = tmp;
204                                 strcat(concat, word);
205                                 ec_free(word);
206                                 word = NULL;
207                         }
208                 }
209
210                 if (concat != NULL) {
211                         if (ec_strvec_add(strvec, concat) < 0)
212                                 goto fail;
213                         ec_free(concat);
214                         concat = NULL;
215                 }
216
217                 /* XXX remove all printf comments */
218 //              printf("str off=%zd len=%zd\n", off, len);
219                 off += len;
220         }
221
222         /* in completion mode, append an empty string in the vector if
223          * the input string ends with space */
224         if (completion && last_is_space) {
225                 if (ec_strvec_add(strvec, "") < 0)
226                         goto fail;
227         }
228
229         return strvec;
230
231  fail:
232         ec_free(word);
233         ec_free(concat);
234         ec_strvec_free(strvec);
235         return NULL;
236 }
237
238 static int
239 ec_node_sh_lex_parse(const struct ec_node *gen_node,
240                 struct ec_parsed *state,
241                 const struct ec_strvec *strvec)
242 {
243         struct ec_node_sh_lex *node = (struct ec_node_sh_lex *)gen_node;
244         struct ec_strvec *new_vec = NULL;
245         struct ec_parsed *child_parsed;
246         const char *str;
247         int ret;
248
249         if (ec_strvec_len(strvec) == 0) {
250                 new_vec = ec_strvec();
251         } else {
252                 str = ec_strvec_val(strvec, 0);
253                 new_vec = tokenize(str, 0, 0, NULL);
254         }
255         if (new_vec == NULL) {
256                 ret = -ENOMEM;
257                 goto fail;
258         }
259
260         ret = ec_node_parse_child(node->child, state, new_vec);
261         if (ret >= 0) {
262                 if ((unsigned)ret == ec_strvec_len(new_vec)) {
263                         ret = 1;
264                 } else {
265                         child_parsed = ec_parsed_get_last_child(state);
266                         ec_parsed_del_child(state, child_parsed);
267                         ec_parsed_free(child_parsed);
268                         ret = EC_PARSED_NOMATCH;
269                 }
270         }
271
272         ec_strvec_free(new_vec);
273         new_vec = NULL;
274
275         return ret;
276
277  fail:
278         ec_strvec_free(new_vec);
279         return ret;
280 }
281
282 static struct ec_completed *ec_node_sh_lex_complete(const struct ec_node *gen_node,
283         const struct ec_strvec *strvec)
284 {
285         struct ec_node_sh_lex *node = (struct ec_node_sh_lex *)gen_node;
286         struct ec_completed *completed, *child_completed = NULL;
287         struct ec_strvec *new_vec = NULL;
288         const char *str;
289         char missing_quote;
290
291 //      printf("==================\n");
292         completed = ec_completed();
293         if (completed == NULL)
294                 return NULL;
295
296         if (ec_strvec_len(strvec) != 1)
297                 return completed;
298
299         str = ec_strvec_val(strvec, 0);
300         new_vec = tokenize(str, 1, 1, &missing_quote);
301         if (new_vec == NULL)
302                 goto fail;
303
304 //      ec_strvec_dump(new_vec, stdout);
305
306         child_completed = ec_node_complete_strvec(node->child, new_vec);
307         if (child_completed == NULL)
308                 goto fail;
309
310         ec_strvec_free(new_vec);
311         new_vec = NULL;
312         ec_completed_merge(completed, child_completed);
313
314         return completed;
315
316  fail:
317         ec_strvec_free(new_vec);
318         ec_completed_free(completed);
319         return NULL;
320 }
321
322 static void ec_node_sh_lex_free_priv(struct ec_node *gen_node)
323 {
324         struct ec_node_sh_lex *node = (struct ec_node_sh_lex *)gen_node;
325
326         ec_node_free(node->child);
327 }
328
329 static struct ec_node_type ec_node_sh_lex_type = {
330         .name = "sh_lex",
331         .parse = ec_node_sh_lex_parse,
332         .complete = ec_node_sh_lex_complete,
333         .size = sizeof(struct ec_node_sh_lex),
334         .free_priv = ec_node_sh_lex_free_priv,
335 };
336
337 EC_NODE_TYPE_REGISTER(ec_node_sh_lex_type);
338
339 struct ec_node *ec_node_sh_lex(const char *id, struct ec_node *child)
340 {
341         struct ec_node_sh_lex *node = NULL;
342
343         if (child == NULL)
344                 return NULL;
345
346         node = (struct ec_node_sh_lex *)__ec_node(&ec_node_sh_lex_type, id);
347         if (node == NULL) {
348                 ec_node_free(child);
349                 return NULL;
350         }
351
352         node->child = child;
353
354         return &node->gen;
355 }
356
357 static int ec_node_sh_lex_testcase(void)
358 {
359         struct ec_node *node;
360         int ret = 0;
361
362         node = ec_node_sh_lex(NULL,
363                 EC_NODE_SEQ(NULL,
364                         ec_node_str(NULL, "foo"),
365                         ec_node_option(NULL,
366                                 ec_node_str(NULL, "toto")
367                         ),
368                         ec_node_str(NULL, "bar")
369                 )
370         );
371         if (node == NULL) {
372                 ec_log(EC_LOG_ERR, "cannot create node\n");
373                 return -1;
374         }
375         ret |= EC_TEST_CHECK_PARSE(node, 1, "foo bar");
376         ret |= EC_TEST_CHECK_PARSE(node, 1, "  foo   bar");
377         ret |= EC_TEST_CHECK_PARSE(node, 1, "  'foo' \"bar\"");
378         ret |= EC_TEST_CHECK_PARSE(node, 1, "  'f'oo 'toto' bar");
379         ec_node_free(node);
380
381         /* test completion */
382         node = ec_node_sh_lex(NULL,
383                 EC_NODE_SEQ(NULL,
384                         ec_node_str(NULL, "foo"),
385                         ec_node_option(NULL,
386                                 ec_node_str(NULL, "toto")
387                         ),
388                         ec_node_str(NULL, "bar"),
389                         ec_node_str(NULL, "titi")
390                 )
391         );
392         if (node == NULL) {
393                 ec_log(EC_LOG_ERR, "cannot create node\n");
394                 return -1;
395         }
396         ret |= EC_TEST_CHECK_COMPLETE(node,
397                 "", EC_NODE_ENDLIST,
398                 "foo", EC_NODE_ENDLIST,
399                 "foo");
400         ret |= EC_TEST_CHECK_COMPLETE(node,
401                 " ", EC_NODE_ENDLIST,
402                 "foo", EC_NODE_ENDLIST,
403                 "foo");
404         ret |= EC_TEST_CHECK_COMPLETE(node,
405                 "f", EC_NODE_ENDLIST,
406                 "oo", EC_NODE_ENDLIST,
407                 "oo");
408         ret |= EC_TEST_CHECK_COMPLETE(node,
409                 "foo", EC_NODE_ENDLIST,
410                 "", EC_NODE_ENDLIST,
411                 "");
412         ret |= EC_TEST_CHECK_COMPLETE(node,
413                 "foo ", EC_NODE_ENDLIST,
414                 "bar", "toto", EC_NODE_ENDLIST,
415                 "");
416         ret |= EC_TEST_CHECK_COMPLETE(node,
417                 "foo t", EC_NODE_ENDLIST,
418                 "oto", EC_NODE_ENDLIST,
419                 "oto");
420         ret |= EC_TEST_CHECK_COMPLETE(node,
421                 "foo b", EC_NODE_ENDLIST,
422                 "ar", EC_NODE_ENDLIST,
423                 "ar");
424         ret |= EC_TEST_CHECK_COMPLETE(node,
425                 "foo bar", EC_NODE_ENDLIST,
426                 "", EC_NODE_ENDLIST,
427                 "");
428         ret |= EC_TEST_CHECK_COMPLETE(node,
429                 "foo bar ", EC_NODE_ENDLIST,
430                 "titi", EC_NODE_ENDLIST,
431                 "titi");
432         ret |= EC_TEST_CHECK_COMPLETE(node,
433                 "foo toto bar ", EC_NODE_ENDLIST,
434                 "titi", EC_NODE_ENDLIST,
435                 "titi");
436         ret |= EC_TEST_CHECK_COMPLETE(node,
437                 "x", EC_NODE_ENDLIST,
438                 EC_NODE_ENDLIST,
439                 "");
440         ret |= EC_TEST_CHECK_COMPLETE(node,
441                 "foo barx", EC_NODE_ENDLIST,
442                 EC_NODE_ENDLIST,
443                 "");
444
445         ec_node_free(node);
446         return ret;
447 }
448
449 static struct ec_test ec_node_sh_lex_test = {
450         .name = "node_sh_lex",
451         .test = ec_node_sh_lex_testcase,
452 };
453
454 EC_TEST_REGISTER(ec_node_sh_lex_test);