问题太关注于具体案例了,我先抽象成为一个问题:把if-else的代码风格改成表格驱动法的意义在哪里?
表格驱动的意义在于:逻辑和数据分离。
这一点@
Ivony已经提过了,但是现实意义我想这里补充一下。
在程序中,添加数据和逻辑的方式是不一样的,成本也是不一样的。简单的说,数据的添加是非常简单,低成本和低风险的;而逻辑的添加是复杂,高成本和高风险的。
用PHP举个例子吧,比如说,国家简写转换,给一个国家全名,转换成国家简写,用if-else法就写成:
<?php function contry_initial($country){ if ($country==="China" ){ return "CHN"; }else if($country==="America"){ return "USA"; }else if($country==="Japan"){ return "JPN"; }else{ return "OTHER"; } }
如果我要增加一个国家,那么我要多加一个else if语句,那么我就是增加了一条逻辑
如果改成表驱动法就是:
<?php function contry_initial($country){ $countryList=[ "China"=> "CHN", "America"=> "USA", "Japan"=> "JPN", ]; if(in_array($country, array_keys($countryList))) { return $countryList[$country]; } return "Other"; }
如果我增加一个国家,我需要在数组里面加个数据
那么接下来,我就可以剥离这个数据与逻辑的关系了。
<?php function contry_initial($country, array $countryList){ if(in_array($country, array_keys($countryList))) { return $countryList[$country]; } return "Other"; }
重构到此为止,这样的好处在哪里?
1) 代码本身的优势
可以想象如果没有表格法,弄个多语言,要写多少语句。
2)数据来源的灵活性
接下来我们再来看看这个国家表格数据来源,如果是数据表格:
等等,只要数据能转化成数组即可。
而逻辑,必须写死在代码中,无法灵活地重新定义。
3)数据输入修改的成本与风险
我们想想,聘用一个不懂编程,但培训一下就会用后台的客服便宜,还是会一个懂系统开发人员便宜?
如果这个是数据,是来自于数据库的,那么基本上公司的任何有权限的人在后台把这个映射表填一下,就能正常工作了。这个耗费与风险几乎可以忽略不计。 如果数据来自第三方API,如果第三方添加修改了数据,你也是基本放心的。
但是如果这个是逻辑本身,那么只能是这个系统开发人员进行修改,构建,然后经过一系列的测试,进行专业部署流程,使得这个功能在产品上运行,是个耗费与风险是不言而喻的。另外考虑到多人开发,开发风格不统一的话,那么开发成本和代码审查就不可避免了
4) 数据格式的强制性和代码风格的随意性
在现实工程中,多人开发一个功能很常见。这里就有一个多人代码风格的问题了。你如何确保别人的代码中的逻辑一定对呢?
对于数据来说,一但数据格式被代码确定后,数据格式就是强制性的了。
比如这个例子,无论是谁,加几个美国的数据也只能这样加:
<?php $countryList=[ "China"=> "CHN", "America"=> "USA", "Japan"=> "JPN", "US"=> "USA", "United States of America"=> "USA", "美国"=> "USA", ];
就算原始数据结构的花样丰富,最终数据必须格式化成如此。
然而如果是逻辑的话,开发人员一多,逻辑方法就可能发生变化。你可能指望对方这样写代码:
<?php if ($country==="China" ){ return "CHN"; }else if($country==="America"){ return "USA"; }else if($country==="Japan"){ return "JPN"; }else if($country==="US"){ return "USA"; }else if($country==="United States of America"){ return "USA"; }else if($country==="美国"){ return "USA"; }else{ return "OTHER"; }
然而,对方可能会这样写:
<?php if ($country === "China") { return "CHN"; } else if (in_array($country, ["America", "US", "United States of America", "美国"])) { return "USA"; } else if ($country === "Japan") { return "JPN"; } else { return "" }
后来多了一个日本的需求,又交给另外不同的人去写,说不定最后如此:
<?php if ($country === "China") { return "CHN"; } else if (in_array($country, ["America", "US", "United States of America", "美国"])) { return "USA"; } else if ($country === "Japan"||$country === "日本") { return "JPN"; } else { return "" }
这样写,都没有错,然而风格却大相径庭。就是在多人合作编程过程中,无法控制所有人的风格,如果需要统一风格,必须依靠代码审查和大量修改,这需要大量资源和成本。
另外,就是因为如此,所有和if else相关的逻辑在单元测试中必须进行一次测试,才能确保逻辑代码的正确性,保证逻辑区域会正确运行;而如果是数据,由于数据格式的可控性,无需对数据进行测试。
由此可见:
总结:
所有编程书籍上面都是从语言本身来解释重构的;我在这里是通过项目实践过程中现实意义来解释这个重构。重构if-else成表驱动的在一个项目现实意义总结一下就是:
--------------分割线-----
在回头用我上面的观点看看问题的代码:那朋友的重构也是有意义的,因为这个表格可以进一步分离出去的。就算一个评分算法的个数不变了,但评分中参照数据的在未来是要修改的,那么修改数值数据比修改数值逻辑要便宜的多。
首先回答问题:
这样做是有意义的。
但是提问者和举例子的人理解都有偏差。
首先是提问者说的改写后逻辑反而不清晰了,这里有两个原因,一是对函数式和声明式编程的不熟悉,下意识的希望控制所有的代码逻辑和细节,缺乏高层思维。其次就是这些例子脱离实际,重写的也不够彻底。
那么简单来说说这样的重构为何有意义?
首先某高票答案的说法基本完全无法认同,无论何种分支代码代码最终必然是条件跳转,分支只能从一种形式转换为另一种形式这种说法毫无意义,因为这里的重构完全与分支无关。
这里重构的意义在于把数据剥离出来!
虽然我觉得理解这个对于初学者而言有一定的难度,但是要理解这样的重构,还是必须从这个层面来讨论。
function doSomething( a ) { if ( a === 'x' ) doX(); else if ( a === 'y' ) doY(); else doZ(); }
重构之后:
function doSomething(a) { var lookup = {x: doX, y: doY}, def = doZ; //数据 (lookup[a] || def)(); //实现 }
这个重构的目的其实是在于,把数据从实现中剥离出来。
为什么要这么做?
原因一:
相较于实现逻辑,数据变更的可能性更大,例如我需要增加一个a==='h'的时候也执行doX,那么直接修改数据就比修改if ... else要方便。在强类型设计语言中,强数据类型可以确保数据的完整性,修改数据比修改代码要安全得多。这也是为什么我们做一个程序有一堆配置的原因,因为相较于修改代码,配置的修改,要安全得多。
原因二:
分析和阅读一段代码的时候,很多时候是有侧重面的,有时候侧重于数据,有时候侧重于逻辑。假设我们有这样一个需求,当某某值小于100时,就如何如何。那这个里面的100就是数据,当需求变更为某某值小于200时,才如何如何,那么我们关注的点在于这个数据的修改。而不是整个逻辑的修改,数据的剥离,有助于我们更快的发现修改点和修改代码。
事实上通常用于消除魔幻数字的named data,本质上也是从实现中剥离数据的一种方式。
命名数据的例子:
var maxAge = 100; //... if ( age > maxAge ) error( "invalid age." );
消除魔幻数字的例子:
var actiontoken_insert = 0; //... if ( action === actiontoken_insert ) insert( data );
但是消除魔幻数字更彻底的方式是基于约定,将token与具体的实现逻辑基于约定进行自动的匹配,去除无意义的match代码,更彻底的消除魔幻数字:
dataActions[action]( data );
原因三:
数据和实现分别可以重用,而数据和实现的重用方式和逻辑却不尽相同。数据从实现逻辑中剥离,能够为接下来的消除重复代码做好准备工作。
以上是这样做为什么是有意义的。
然后说这个例子中的不妥之处。
首先第一个例子很明显这个a==='x',a==='y'中的x和y也是一种魔幻数字,只不过变成了字符串这种更高级的形式了。
所以我们需要去解决的是消灭掉这段逻辑,从数据源头把x和y这种魔幻数字给干掉,变成更有意义的表达形式,然后再通过约定来直接消灭掉中间的match的过程,省略掉mapping数据。
第二个例子中将数据提取出来后,可以明显的看出来这是一个连续的区间,既然是连续区间,那么写成很多个数组显然是错误的,应当进一步将数据合并成为一个数组,再将实现逻辑剥离为通用函数,改为函数调用:
var ranges = [7, 9, 11, 30, 45, 60, 75, 90] var currentRange = getRange( score, ranges );
当然,任何事情都有一个度,数据的剥离自然是正确的,但也有其成本和收益,若收益低于成本,例如逻辑实在过于简单,或者说数据和逻辑混杂太深难以剥离,那么此时剥离数据并不总是对的。