Rizin
unix-like reverse engineering framework and cli tools
parse_sh_pseudo.c
Go to the documentation of this file.
1 // SPDX-FileCopyrightText: 2017-2021 deroad <wargio@libero.it>
2 // SPDX-License-Identifier: LGPL-3.0-only
3 
4 #include <stdio.h>
5 #include <stdlib.h>
6 #include <string.h>
7 
8 #include <rz_lib.h>
9 #include <rz_util.h>
10 #include <rz_flag.h>
11 #include <rz_analysis.h>
12 #include <rz_parse.h>
13 
14 #include "parse_common.c"
15 
16 static RzList *sh_tokenize(const char *assembly, size_t length);
17 
18 static const RzPseudoGrammar sh_lexicon[] = {
19  RZ_PSEUDO_DEFINE_GRAMMAR("add", "2 += 1"),
20  RZ_PSEUDO_DEFINE_GRAMMAR("addc", "2 += 1 + t"),
21  RZ_PSEUDO_DEFINE_GRAMMAR("addv", "2 += 1; t = int_overflow (2)"),
22  RZ_PSEUDO_DEFINE_GRAMMAR("and", "2 &= 1"),
23  RZ_PSEUDO_DEFINE_GRAMMAR("and.b", "2 &= 1"),
24  RZ_PSEUDO_DEFINE_GRAMMAR("bf", "if (!t) goto 1"),
25  RZ_PSEUDO_DEFINE_GRAMMAR("bf/s", "if (!t) goto 1"),
26  RZ_PSEUDO_DEFINE_GRAMMAR("bra", "goto 1"),
27  RZ_PSEUDO_DEFINE_GRAMMAR("brk", "_break_exception ()"),
28  RZ_PSEUDO_DEFINE_GRAMMAR("bsr", "1 ()"),
29  RZ_PSEUDO_DEFINE_GRAMMAR("bsrf", "1 ()"),
30  RZ_PSEUDO_DEFINE_GRAMMAR("bt", "if (t) goto 1"),
31  RZ_PSEUDO_DEFINE_GRAMMAR("bt/s", "if (t) goto 1"),
32  RZ_PSEUDO_DEFINE_GRAMMAR("clrmac", "_clrmac ()"),
33  RZ_PSEUDO_DEFINE_GRAMMAR("clrs", "_clrs ()"),
34  RZ_PSEUDO_DEFINE_GRAMMAR("clrt", "_clrt ()"),
35  RZ_PSEUDO_DEFINE_GRAMMAR("cmp/eq", "t = 2 == 1 ? #1 : 0"),
36  RZ_PSEUDO_DEFINE_GRAMMAR("cmp/ge", "t = 2 >= 1 ? #1 : 0"),
37  RZ_PSEUDO_DEFINE_GRAMMAR("cmp/gt", "t = 2 > 1 ? #1 : 0"),
38  RZ_PSEUDO_DEFINE_GRAMMAR("cmp/hi", "t = (unsigned) 2 > (unsigned) 1 ? #1 : 0"),
39  RZ_PSEUDO_DEFINE_GRAMMAR("cmp/hs", "t = (unsigned) 2 >= (unsigned) 1 ? #1 : 0"),
40  RZ_PSEUDO_DEFINE_GRAMMAR("cmp/pl", "t = 1 > 0 ? #1 : 0"),
41  RZ_PSEUDO_DEFINE_GRAMMAR("cmp/pz", "t = 1 >= 0 ? #1 : 0"),
42  RZ_PSEUDO_DEFINE_GRAMMAR("cmp/str", "t = 1 ^ 2 ? #1 : 0"),
43  RZ_PSEUDO_DEFINE_GRAMMAR("div1", "2 /= 1"),
44  RZ_PSEUDO_DEFINE_GRAMMAR("dmuls.l", "mac = 2 * 1"),
45  RZ_PSEUDO_DEFINE_GRAMMAR("dmulu.l", "mac = (unsigned) 2 * (unsigned) 1"),
46  RZ_PSEUDO_DEFINE_GRAMMAR("dt", "1--; t = !1 ? #1 : 0"),
47  RZ_PSEUDO_DEFINE_GRAMMAR("exts.b", "2 = (int) 1"),
48  RZ_PSEUDO_DEFINE_GRAMMAR("exts.w", "2 = (int) 1"),
49  RZ_PSEUDO_DEFINE_GRAMMAR("extu.b", "2 = (unsigned int) 1"),
50  RZ_PSEUDO_DEFINE_GRAMMAR("extu.w", "2 = (unsigned int) 1"),
51  RZ_PSEUDO_DEFINE_GRAMMAR("fabs", "1 = abs (1)"),
52  RZ_PSEUDO_DEFINE_GRAMMAR("fadd", "2 += 1"),
53  RZ_PSEUDO_DEFINE_GRAMMAR("fcmp/eq", "t = 2 == 1 ? #1 : 0"),
54  RZ_PSEUDO_DEFINE_GRAMMAR("fcmp/gt", "t = 2 > 1 ? #1 : 0"),
55  RZ_PSEUDO_DEFINE_GRAMMAR("fcnvds", "2 = 1"),
56  RZ_PSEUDO_DEFINE_GRAMMAR("fdiv", "2 /= 1"),
57  RZ_PSEUDO_DEFINE_GRAMMAR("fldi0", "1 = 0.0f"),
58  RZ_PSEUDO_DEFINE_GRAMMAR("fldi1", "1 = #1.0f"),
59  RZ_PSEUDO_DEFINE_GRAMMAR("flds", "2 = 1"),
60  RZ_PSEUDO_DEFINE_GRAMMAR("float", "2 = 1"),
61  RZ_PSEUDO_DEFINE_GRAMMAR("fmac", "3 += 1 * 2"),
62  RZ_PSEUDO_DEFINE_GRAMMAR("fmov", "2 = 1"),
63  RZ_PSEUDO_DEFINE_GRAMMAR("fmov.s", "2 = 1"),
64  RZ_PSEUDO_DEFINE_GRAMMAR("fmul", "2 *= 1"),
65  RZ_PSEUDO_DEFINE_GRAMMAR("fneg", "1 = -1"),
66  RZ_PSEUDO_DEFINE_GRAMMAR("fsqrt", "1 = sqrt (1)"),
67  RZ_PSEUDO_DEFINE_GRAMMAR("fsts", "2 = 1"),
68  RZ_PSEUDO_DEFINE_GRAMMAR("fsub", "2 -= 1"),
69  RZ_PSEUDO_DEFINE_GRAMMAR("ftrc", "2 = trunc (1)"),
70  RZ_PSEUDO_DEFINE_GRAMMAR("ftrv", "2 *= 1"),
71  RZ_PSEUDO_DEFINE_GRAMMAR("jmp", "goto 1"),
72  RZ_PSEUDO_DEFINE_GRAMMAR("jsr", "1 ()"),
73  RZ_PSEUDO_DEFINE_GRAMMAR("ldr", "2 = 1"),
74  RZ_PSEUDO_DEFINE_GRAMMAR("ldr.l", "2 = 1"),
75  RZ_PSEUDO_DEFINE_GRAMMAR("lds", "2 = 1"),
76  RZ_PSEUDO_DEFINE_GRAMMAR("lds.l", "2 = 1"),
77  RZ_PSEUDO_DEFINE_GRAMMAR("mov", "2 = 1"),
78  RZ_PSEUDO_DEFINE_GRAMMAR("mov.b", "2 = 1"),
79  RZ_PSEUDO_DEFINE_GRAMMAR("mov.l", "2 = 1"),
80  RZ_PSEUDO_DEFINE_GRAMMAR("mov.w", "2 = 1"),
81  RZ_PSEUDO_DEFINE_GRAMMAR("movca.l", "2 = 1"),
82  RZ_PSEUDO_DEFINE_GRAMMAR("movt", "1 = t"),
83  RZ_PSEUDO_DEFINE_GRAMMAR("muls.w", "macl = 1 * 2"),
84  RZ_PSEUDO_DEFINE_GRAMMAR("mulu.w", "macl = (unsigned) 1 * (unsigned) 2"),
85  RZ_PSEUDO_DEFINE_GRAMMAR("neg", "1 = -1"),
86  RZ_PSEUDO_DEFINE_GRAMMAR("negc", "1 = (-1) - t"),
87  RZ_PSEUDO_DEFINE_GRAMMAR("nop", ""),
88  RZ_PSEUDO_DEFINE_GRAMMAR("not", "1 = !1"),
89  RZ_PSEUDO_DEFINE_GRAMMAR("or", "2 |= 1"),
90  RZ_PSEUDO_DEFINE_GRAMMAR("rotcl", "t = 1 & 0x#80000000 ? 0 : #1; 1 = (1 << #1) | t"),
91  RZ_PSEUDO_DEFINE_GRAMMAR("rotl", "1 = (1 << #1) | (1 >> #31)"),
92  RZ_PSEUDO_DEFINE_GRAMMAR("rotr", "1 = (1 << #31) | (1 >> #1)"),
93  RZ_PSEUDO_DEFINE_GRAMMAR("rte", "_rte ()"),
94  RZ_PSEUDO_DEFINE_GRAMMAR("rts", "return"),
95  RZ_PSEUDO_DEFINE_GRAMMAR("sets", "s = #1"),
96  RZ_PSEUDO_DEFINE_GRAMMAR("sett", "t = #1"),
97  RZ_PSEUDO_DEFINE_GRAMMAR("shad", "2 = 1 >= 0 ? 2 << 1 | 2 >> (#31 - 1)"),
98  RZ_PSEUDO_DEFINE_GRAMMAR("shal", "1 <<= #1"),
99  RZ_PSEUDO_DEFINE_GRAMMAR("shar", "1 >>= #1"),
100  RZ_PSEUDO_DEFINE_GRAMMAR("shld", "2 = 1 >= 0 ? 2 << 1 | 2 >> (#31 - 1)"),
101  RZ_PSEUDO_DEFINE_GRAMMAR("shll", "1 <<= #1"),
102  RZ_PSEUDO_DEFINE_GRAMMAR("shll16", "1 <<= #16"),
103  RZ_PSEUDO_DEFINE_GRAMMAR("shll2", "1 <<= #2"),
104  RZ_PSEUDO_DEFINE_GRAMMAR("shll8", "1 <<= #8"),
105  RZ_PSEUDO_DEFINE_GRAMMAR("shlr", "1 >>= #1"),
106  RZ_PSEUDO_DEFINE_GRAMMAR("shlr16", "1 >>= #16"),
107  RZ_PSEUDO_DEFINE_GRAMMAR("shlr2", "1 >>= #2"),
108  RZ_PSEUDO_DEFINE_GRAMMAR("shlr8", "1 >>= #8"),
109  RZ_PSEUDO_DEFINE_GRAMMAR("sleep", "_halt ()"),
110  RZ_PSEUDO_DEFINE_GRAMMAR("stc", "2 = 1"),
111  RZ_PSEUDO_DEFINE_GRAMMAR("stc.l", "2 = 1"),
112  RZ_PSEUDO_DEFINE_GRAMMAR("sts", "2 = 1"),
113  RZ_PSEUDO_DEFINE_GRAMMAR("sts.l", "2 = 1"),
114  RZ_PSEUDO_DEFINE_GRAMMAR("sub", "2 -= 1"),
115  RZ_PSEUDO_DEFINE_GRAMMAR("subc", "2 -= 1 - t"),
116  RZ_PSEUDO_DEFINE_GRAMMAR("subv", "2 -= 1; t = int_underflow (2)"),
117  RZ_PSEUDO_DEFINE_GRAMMAR("swap.b", "swap_byte (2, 1)"),
118  RZ_PSEUDO_DEFINE_GRAMMAR("swap.w", "swap_word (2, 1)"),
119  RZ_PSEUDO_DEFINE_GRAMMAR("tas.b", "test_and_set (1)"),
120  RZ_PSEUDO_DEFINE_GRAMMAR("trapa", "trap (1)"),
121  RZ_PSEUDO_DEFINE_GRAMMAR("tst", "t = 2 & 1 ? 0 : #1"),
122  RZ_PSEUDO_DEFINE_GRAMMAR("xor", "2 ^= 1"),
123  RZ_PSEUDO_DEFINE_GRAMMAR("xor.b", "2 ^= 1"),
124 };
125 
126 static const RzPseudoReplace sh_replace[] = {
127  RZ_PSEUDO_DEFINE_REPLACE("+ -", "- ", 1),
128 };
129 
131 
132 RzList *sh_tokenize(const char *assembly, size_t length) {
133  size_t i, p;
134  char *buf = NULL;
135  bool ignore_comma = false;
136  RzList *tokens = NULL;
137 
138  buf = rz_str_ndup(assembly, length);
139  if (!buf) {
140  return NULL;
141  }
142 
143  for (i = 0, p = 0; p < length; ++i, ++p) {
144  if (buf[p] == ',' && !ignore_comma) {
145  p++;
146  } else if (buf[p] == '(') {
147  ignore_comma = true;
148  } else if (buf[p] == ')') {
149  ignore_comma = false;
150  }
151  if (p > i) {
152  buf[i] = buf[p];
153  }
154  }
155  buf[i] = 0;
156 
157  tokens = rz_str_split_duplist(buf, " ", true);
158  free(buf);
159  if (!tokens) {
160  return NULL;
161  }
162 
163  RzListIter *it;
164  rz_list_foreach (tokens, it, buf) {
165  it->data = rz_str_replace(buf, ",", " + ", 1);
166  }
167 
168  return tokens;
169 }
170 
171 static bool parse(RzParse *parse, const char *assembly, RzStrBuf *sb) {
172  return rz_pseudo_convert(&sh_config, assembly, sb);
173 }
174 
176  .name = "sh.pseudo",
177  .desc = "SH-4 pseudo syntax",
178  .parse = parse
179 };
180 
181 #ifndef RZ_PLUGIN_INCORE
184  .data = &rz_parse_plugin_sh_pseudo,
185  .version = RZ_VERSION
186 };
187 #endif
lzma_index ** i
Definition: index.h:629
static SblHeader sb
Definition: bin_mbn.c:26
#define RZ_API
#define NULL
Definition: cris-opc.c:27
static static sync static getppid static getegid const char static filename char static len const char char static bufsiz static mask static vfork const void static prot static getpgrp const char static swapflags static arg static fd static protocol static who struct sockaddr static addrlen static backlog struct timeval struct timezone static tz const struct iovec static count static mode const void const struct sockaddr static tolen const char static pathname void static offset struct stat static buf void long static basep static whence static length const void static len static semflg const void static shmflg const struct timespec struct timespec static rem const char static group const void length
Definition: sflib.h:133
RZ_API void Ht_() free(HtName_(Ht) *ht)
Definition: ht_inc.c:130
voidpf void * buf
Definition: ioapi.h:138
void * p
Definition: libc.cpp:67
#define RZ_PSEUDO_DEFINE_REPLACE(x, y, f)
Definition: parse_common.c:64
static bool rz_pseudo_convert(const RzPseudoConfig *config, const char *assembly, RzStrBuf *sb)
Definition: parse_common.c:103
#define RZ_PSEUDO_DEFINE_CONFIG_NO_DIRECT(l, r, m, t)
Definition: parse_common.c:79
#define RZ_PSEUDO_DEFINE_GRAMMAR(x, y)
Definition: parse_common.c:58
static const RzPseudoConfig sh_config
RzParsePlugin rz_parse_plugin_sh_pseudo
RZ_API RzLibStruct rizin_plugin
static const RzPseudoGrammar sh_lexicon[]
static bool parse(RzParse *parse, const char *assembly, RzStrBuf *sb)
static const RzPseudoReplace sh_replace[]
static RzList * sh_tokenize(const char *assembly, size_t length)
@ RZ_LIB_TYPE_PARSE
Definition: rz_lib.h:74
RZ_API char * rz_str_ndup(RZ_NULLABLE const char *ptr, int len)
Create new copy of string ptr limited to size len.
Definition: str.c:1006
RZ_API RzList * rz_str_split_duplist(const char *str, const char *c, bool trim)
Split the string str according to the substring c and returns a RzList with the result.
Definition: str.c:3464
RZ_API char * rz_str_replace(char *str, const char *key, const char *val, int g)
Definition: str.c:1110
#define RZ_VERSION
Definition: rz_version.h:8
Definition: regcomp.c:57
void * data
Definition: rz_list.h:14