分类：技术管理

使用N8N工作流自动化解决三方API数据对接

2022-08-25 by wwek·0评论

title: 使用N8N工作流自动化解决三方API数据对接

0、n8n是什么？

n8n 是免费的基于节点的工作流自动化工具，可以轻松实现跨不同服务的任务自动化。它可以自托管，易于扩展，因此也可以与内部工具一起使用。

1、安装

参见n8n官方文档^[1]，推荐docker安装

2、需求案例

在商业推广中往往有一些API对接的需求，细分下来有这几类
* ① 通用广告投放平台如果是广点通、巨量引擎、橙子建站线索API对接等
* ② 我方开放API
* ③ 三方API对接
市场推广活动会产生三方API对接的需求。
这样的需求去基于代码开发的方式对接，对于开发者来说价值不高，使用N8N能解决这种对接问题

例如一个推广服务商使用API提供线索，需要实现全自动化同步到我方系统

工作流逻辑上就是：计划任务周期运行 > 读取数据通过API（三方） > 数据转换处理 > 写入数据通过API（我方）

3、n8n实现

n8n工作流可视化效果图
使用N8N工作流自动化解决三方API数据对接

共需 4个核心节点（node）（写入excel文件可忽略）
计划任务周期运行Cron CORE NODES > Flow > Cron
读取数据通过API（三方）DEVELOPMENT > HTTP Request
数据转换处理 CORE NODES > Function
写入数据通过API（我方）DEVELOPMENT > HTTP Request

主要说下数据转换处理

数据转换处理把接口返回数据变成 n8n中 items列表
接口返回数据在n8n中默认为items，由于返回的多条数据是在json中data字段中，需要做个转换取出来转换成n8n中 items列表供下游节点使用。
items[0].json.data 取接口返回数据，json数据，data字段

let rows = []; 

for (item of items[0].json.data) {
  rows.push(item);
}

console.log('Done!');
return rows;

在n8n中的函数代码都是js编写的

数据转换处理好后，items就有多个了，本工作流中取到了3个items，对于「写入数据通过API」就会调用3次

4、参考

1. n8n官方文档

DolphinScheduler 调度 DataX 实现 MySQL To MySQL 增量数据同步实战

2022-03-03 by wwek·0评论

背景

MySQL库A 到 MySQL库B的增量数据同步需求

DolphinScheduler中配置DataX MySQL To MySQL工作流

工作流定义

工作流定义 > 创建工作流 > 拖入1个SHELL组件 > 拖入1个DATAX组件
SHELL组件(文章)
脚本

echo '文章同步 MySQL To MySQL'

DATAX组件(t_article)
用到2个插件mysqlreader^[1]、mysqlwriter^[2]
选自定义模板：

{
    "job": {
        "content": [
            {
                "reader": {
                    "name": "mysqlreader",
                    "parameter": {
                        "connection": [
                            {
                                "jdbcUrl": [
                                    "jdbc:mysql://${biz_mysql_host}:${biz_mysql_port}/你的数据库A?useUnicode=true&zeroDateTimeBehavior=convertToNull&characterEncoding=UTF8&autoReconnect=true&useSSL=false&&allowLoadLocalInfile=false&autoDeserialize=false&allowLocalInfile=false&allowUrlInLocalInfile=false"
                                ],
                                "querySql": [
                                    "select a.id,a.title,a.content,a.is_delete,a.delete_date,a.create_date,a.update_date from t_article a.update_date >= '${biz_update_dt}';"
                                ]
                            }
                        ],
                        "password": "${biz_mysql_password}",
                        "username": "${biz_mysql_username}"
                    }
                },
                "writer": {
                    "name": "mysqlwriter",
                    "parameter": {
                        "column": [
                            "`id`",
                            "`title`",
                            "`content`",
                            "`is_delete`",
                            "`delete_date`",
                            "`create_date`",
                            "`update_date`"
                        ],
                        "connection": [
                            {
                                "jdbcUrl": "jdbc:mysql://${biz_mysql_host}:${biz_mysql_port}/你的数据库B?useUnicode=true&zeroDateTimeBehavior=convertToNull&characterEncoding=UTF8&autoReconnect=true&useSSL=false&&allowLoadLocalInfile=false&autoDeserialize=false&allowLocalInfile=false&allowUrlInLocalInfile=false",
                                "table": [
                                    "t_article"
                                ]
                            }
                        ],
                        "writeMode": "replace",
                        "password": "${biz_mysql_password}",
                        "username": "${biz_mysql_username}"
                    }
                }
            }
        ],
        "setting": {
            "errorLimit": {
                "percentage": 0,
                "record": 0
            },
            "speed": {
                "channel": 1,
                "record": 1000
            }
        }
    }
}

reader和writer的字段配置需保持一致

自定义参数：

biz_update_dt: ${global_bizdate}
biz_mysql_host: 你的mysql ip
biz_mysql_port: 3306
biz_mysql_username: 你的mysql账号
biz_mysql_password: 你的mysql密码

# 本文实验环境A库和B库用的同一个实例，如果MySQL是多个实例，可以再新增加参数定义例如 biz_mysql_host_b,在模板中对应引用即可

配置的自定义参数将会自动替换json模板中的同名变量

reader mysqlreader插件中关键配置： a.update_date >= '${biz_update_dt}' 就是实现增量同步的关键配置
writer mysqlwriter插件中关键配置： “

"parameter": {
    "writeMode": "replace",
    ......
}

writeMode为replace，相同主键id重复写入数据，就会更新数据。sql本质上执行的是 replace into

保存工作流

全局变量设置
global_bizdate： $[yyyy-MM-dd 00:00:00-1]

global_bizdate 引用的变量为 DolphinScheduler 内置变量，具体参考官网文档^[3]
结合调度时间设计好时间滚动的窗口时长，比如按1天增量，那么这里时间就是减1天

最终的工作流DAG图为：

爬坑记录

官网下载的DataX不包含ElasticSearchWriter写插件
默认不带该插件，需要自己编译ElasticSearchWriter插件。

git clone https://github.com/alibaba/DataX.git

为了加快编译速度，可以只编译<module>elasticsearchwriter</module>
项目根目录的pom.xml
 全注释掉，下只保留<module>elasticsearchwriter</module>其他注释掉，另外也需要保留

如果自己不想编译或者编译失败请搜索🔍 “流水理鱼”微信公众号，或者加我私人微信我给你已经编译好的插件包

by 流水理鱼|wwek

参考

1. DataX MysqlReader 插件文档 https://github.com/alibaba/DataX/blob/master/mysqlreader/doc/mysqlreader.md
2. DataX MysqlWriter 插件文档 https://github.com/alibaba/DataX/blob/master/mysqlwriter/doc/mysqlwriter.md
3. Apache DolphinScheduler 内置参数 https://dolphinscheduler.apache.org/zh-cn/docs/latest/user_doc/guide/parameter/built-in.html

DolphinScheduler 调度 DataX 实现 MySQL To MySQL 增量数据同步实践

2022-03-02 by wwek·0评论

背景

MySQL库A 到 MySQL库B的增量数据同步需求

DolphinScheduler中配置DataX MySQL To MySQL工作流

工作流定义

工作流定义 > 创建工作流 > 拖入1个SHELL组件 > 拖入1个DATAX组件
SHELL组件(文章)
脚本

echo '文章同步 MySQL To MySQL'

DATAX组件(t_article)
用到2个插件mysqlreader^[1]、mysqlwriter^[2]
选自定义模板：

{
    "job": {
        "content": [
            {
                "reader": {
                    "name": "mysqlreader",
                    "parameter": {
                        "connection": [
                            {
                                "jdbcUrl": [
                                    "jdbc:mysql://${biz_mysql_host}:${biz_mysql_port}/你的数据库A?useUnicode=true&zeroDateTimeBehavior=convertToNull&characterEncoding=UTF8&autoReconnect=true&useSSL=false&&allowLoadLocalInfile=false&autoDeserialize=false&allowLocalInfile=false&allowUrlInLocalInfile=false"
                                ],
                                "querySql": [
                                    "select a.id,a.title,a.content,a.is_delete,a.delete_date,a.create_date,a.update_date from t_article a.update_date >= '${biz_update_dt}';"
                                ]
                            }
                        ],
                        "password": "${biz_mysql_password}",
                        "username": "${biz_mysql_username}"
                    }
                },
                "writer": {
                    "name": "mysqlwriter",
                    "parameter": {
                        "column": [
                            "`id`",
                            "`title`",
                            "`content`",
                            "`is_delete`",
                            "`delete_date`",
                            "`create_date`",
                            "`update_date`"
                        ],
                        "connection": [
                            {
                                "jdbcUrl": "jdbc:mysql://${biz_mysql_host}:${biz_mysql_port}/你的数据库B?useUnicode=true&zeroDateTimeBehavior=convertToNull&characterEncoding=UTF8&autoReconnect=true&useSSL=false&&allowLoadLocalInfile=false&autoDeserialize=false&allowLocalInfile=false&allowUrlInLocalInfile=false",
                                "table": [
                                    "t_article"
                                ]
                            }
                        ],
                        "writeMode": "replace",
                        "password": "${biz_mysql_password}",
                        "username": "${biz_mysql_username}"
                    }
                }
            }
        ],
        "setting": {
            "errorLimit": {
                "percentage": 0,
                "record": 0
            },
            "speed": {
                "channel": 1,
                "record": 1000
            }
        }
    }
}

reader和writer的字段配置需保持一致

自定义参数：

biz_update_dt: ${global_bizdate}
biz_mysql_host: 你的mysql ip
biz_mysql_port: 3306
biz_mysql_username: 你的mysql账号
biz_mysql_password: 你的mysql密码

# 本文实验环境A库和B库用的同一个实例，如果MySQL是多个实例，可以再新增加参数定义例如 biz_mysql_host_b,在模板中对应引用即可

配置的自定义参数将会自动替换json模板中的同名变量

reader mysqlreader插件中关键配置： a.update_date >= '${biz_update_dt}' 就是实现增量同步的关键配置
writer mysqlwriter插件中关键配置： “

"parameter": {
    "writeMode": "replace",
    ......
}

writeMode为replace，相同主键id重复写入数据，就会更新数据。sql本质上执行的是 replace into

保存工作流

全局变量设置
global_bizdate： $[yyyy-MM-dd 00:00:00-1]

最终的工作流DAG图为：

爬坑记录

官网下载的DataX不包含ElasticSearchWriter写插件
默认不带该插件，需要自己编译ElasticSearchWriter插件。

git clone https://github.com/alibaba/DataX.git

如果自己不想编译或者编译失败请搜索🔍 “流水理鱼”微信公众号，或者加我私人微信我给你已经编译好的插件包

by 流水理鱼|wwek

参考

1. DataX MysqlReader 插件文档
 2. DataX MysqlWriter 插件文档
 3. Apache DolphinScheduler 内置参数

DolphinScheduler 调度 DataX 实现 MySQL To ElasticSearch 增量数据同步实践

2022-03-02 by wwek·0评论

数据同步的方式

数据同步的2大方式

基于SQL查询的 CDC(Change Data Capture)：
- 离线调度查询作业，批处理。把一张表同步到其他系统，每次通过查询去获取表中最新的数据。也就是我们说的基于SQL查询抽取；
- 无法保障数据一致性，查的过程中有可能数据已经发生了多次变更；
- 不保障实时性，基于离线调度存在天然的延迟;
- 工具软件以Kettle（Apache Hop最新版）、DataX为代表,需要结合任务调度系统使用。
基于日志的 CDC：
- 实时消费日志，流处理，例如 MySQL 的 binlog 日志完整记录了数据库中的变更，可以把 binlog 文件当作流的数据源；
- 保障数据一致性，因为 binlog 文件包含了所有历史变更明细；
- 保障实时性，因为类似 binlog 的日志文件是可以流式消费的，提供的是实时数据;
- 工具软件以Flink CDC、阿里巴巴Canal、Debezium为代表。

基于SQL查询增量数据同步原理

我们考虑用SQL如何查询增量数据？数据有增加、需改、删除
删除数据采用逻辑删除的方式，比如定义一个is_deleted字段标识逻辑删除
如果数据是 UPDATE的，也就是会被修改的，那么 where update_datetime >= last_datetime(调度滚动时间)就是增量数据
如果数据是 APPEND ONLY 的除了用更新时间还可以用where id >= 调度上次last_id

结合任务调度系统
调度时间是每日调度执行一次，那么 last_datetime = 当前调度开始执行时间 – 24小时，延迟就是1天
调度时间是15分钟一次，那么 last_datetime = 当前调度开始执行时间 – 15分钟，延迟就是15分钟

这样就实现了捕获增量数据，从而实现增量同步

DolphinScheduler + Datax 构建离线增量数据同步平台

本实践使用
单机8c16g
DataX 2022-03-01 官网下载
DolphinScheduler 2.0.3（DolphinScheduler的安装过程略，请参考官网）

DolphinScheduler 中设置好DataX环境变量
DolphinScheduler 提供了可视化的作业流程定义，用来离线定时调度DataX Job作业，使用起来很是顺滑

基于SQL查询离线数据同步的用武之地
为什么不用基于日志实时的方式？不是不用，而是根据场合用。考虑到业务实际需求情况，基于SQL查询这种离线的方式也并非完全淘汰了
特别是业务上实时性要求不高，每次调度增量数据没那么大的情况下，不需要分布式架构来负载，这种情况下是比较合适的选择
场景举例：
网站、APP的百万级、千万级的内容搜索，每天几百篇内容新增+修改，搜索上会用到ES(ElasticSearch)，那么就需要把 MySQL内容数据增量同步到ES
DataX就能满足需求！

DolphinScheduler中配置DataX MySQL To ElasticSearch工作流

工作流定义

工作流定义 > 创建工作流 > 拖入1个SHELL组件 > 拖入1个DATAX组件
SHELL组件(文章)
脚本

echo '文章同步 MySQL To ElasticSearch'

DATAX组件(t_article)
用到2个插件mysqlreader、elasticsearchwriter^[1]
选自定义模板：

{
    "job": {
        "content": [
            {
                "reader": {
                    "name": "mysqlreader",
                    "parameter": {
                        "connection": [
                            {
                                "jdbcUrl": [
                                    "jdbc:mysql://${biz_mysql_host}:${biz_mysql_port}/你的数据库?useUnicode=true&zeroDateTimeBehavior=convertToNull&characterEncoding=UTF8&autoReconnect=true&useSSL=false&&allowLoadLocalInfile=false&autoDeserialize=false&allowLocalInfile=false&allowUrlInLocalInfile=false"
                                ],
                                "querySql": [
                                    "select a.id as pk,a.id,a.title,a.content,a.is_delete,a.delete_date,a.create_date,a.update_date from t_article a.update_date >= '${biz_update_dt}';"
                                ]
                            }
                        ],
                        "password": "${biz_mysql_password}",
                        "username": "${biz_mysql_username}"
                    }
                },
                "writer": {
                    "name": "elasticsearchwriter",
                    "parameter": {
                        "endpoint": "${biz_es_host}",
                        "accessId": "${biz_es_username}",
                        "accessKey": "${biz_es_password}",
                        "index": "t_article",
                        "type": "_doc",
                        "batchSize": 1000,
                        "cleanup": false,
                        "discovery": false,
                        "dynamic": true,
                        "settings": {
                            "index": {
                                "number_of_replicas": 0,
                                "number_of_shards": 1
                            }
                        },
                        "splitter": ",",
                        "column": [
                            {
                                "name": "pk",
                                "type": "id"
                            },
                            {
                                "name": "id",
                                "type": "long"
                            },
                            {
                                "name": "title",
                                "type": "text"
                            },
                            {
                                "name": "content",
                                "type": "text"
                            }
                            {
                                "name": "is_delete",
                                "type": "text"
                            },
                            {
                                "name": "delete_date",
                                "type": "date"
                            },
                            {
                                "name": "create_date",
                                "type": "date"
                            },
                            {
                                "name": "update_date",
                                "type": "date"
                            }
                        ]
                    }
                }
            }
        ],
        "setting": {
            "errorLimit": {
                "percentage": 0,
                "record": 0
            },
            "speed": {
                "channel": 1,
                "record": 1000
            }
        }
    }
}

reader和writer的字段配置需保持一致

自定义参数：

biz_update_dt: ${global_bizdate} 
biz_mysql_host: 你的mysql ip
biz_mysql_port: 3306
biz_mysql_username: 你的mysql账号
biz_mysql_password: 你的mysql密码
biz_es_host: 你的es地址带协议和端口 http://127.0.0.1:9200
biz_es_username: 你的es账号
biz_es_password: 你的es密码

配置的自定义参数将会自动替换json模板中的同名变量

reader mysqlreader插件中关键配置： a.update_date >= '${biz_update_dt}' 就是实现增量同步的关键配置
writer elasticsearchwriter插件中关键配置： “

"column": [
    {
        "name": "pk",
        "type": "id"
    },
    ......
]

type = id 这样配置，就把文章主键映射到es主键 _id 从而实现相同主键id重复写入数据，就会更新数据。如果不这样配置数据将会重复导入es中

保存工作流

全局变量设置
global_bizdate： $[yyyy-MM-dd 00:00:00-1]

global_bizdate 引用的变量为 DolphinScheduler 内置变量，具体参考官网文档^[2]
结合调度时间设计好时间滚动的窗口时长，比如按1天增量，那么这里时间就是减1天

最终的工作流DAG图为：

by 流水理鱼|wwek

参考

1. DataX ElasticSearchWriter 插件文档
 2. Apache DolphinScheduler 内置参数

解决问题黄金三步：定义问题—分解问题—归类分组

2020-05-17 by wwek·0评论

转载，原文张建飞（Frank）解决问题黄金三步：定义问题—分解问题—归

我们经常说软件开发中，没有银弹。的确，单看软件领域，很少有什么方法论是普适的。然而再拔高一些，跳出软件的范畴，是有一些东西是普世的，比如老子说的“道”。

好吧，“道”说的有点大。不过，最近我的确有一个新发现——我发现“归类分组”在我们解决问题中起着巨大的作用。而这里的“问题”不仅仅限于软件设计，从日常生活、产品设计到公司战略、生物分类。都有它的身影。

这是为什么呢？究其原因可能有两个：

一、归类分组是抽象的重要方法，解决复杂问题我们离不开抽象。

二、归类分组是结构化的重要步骤，结构化的表达离不开归类分组。

当然，归类分组要先有素材可以“归类”才行。因此，完整的方法论是这样的，我给他起了一个好听的名字——解决问题黄金三步：定义问题——分解问题——归类分组。

这三步的详细操作如下：

第一步，定义问题：也就是要清楚我们要解决的问题是什么？
第二步，分解问题：对问题进行分析拆解，形成平铺的多个子问题，此步可以尽量发散。
第三步，归类分组：对子问题进行归纳、剪枝，将趋同的子问题，合并成一类问题。

如上图所示，通过黄金三步以后，我们就可以得到一个形同“金字塔”的结构，也就是我们经常说的金字塔结构。根据问题的复杂程度，这个金字塔结构可能是三层，也可能是二层和多层。

看似简单的三步操作会有那么大的作用吗？废话不多说，直接上案例。

在日常生活中的运用

你出门买报纸，你老婆说家里冰箱空了，顺便带点东西回来吧。她给你列了一个清单，里面有葡萄，橘子，咸鸭蛋，土豆，鸡蛋。你说就这么多了吗？她说苹果和胡萝卜也可以买一点。当你准备出门的时候，她说家里的牛奶和酸奶也没有了，最好也买一点回来。

你觉得你能把老婆交代的东西都买齐吗？我看很难，因为我们的大脑短期记忆无法一次容纳7个以上的记忆项目，超过5个时，我们就会开始将不同的项目归类到不同的逻辑范畴，以便于记忆。

如果我们将葡萄，橘子，牛奶，咸鸭蛋，土豆，鸡蛋、胡萝、苹果，酸奶。按照逻辑关系，进行下归类分组，比如把葡萄、橘子、苹果归为水果类，把土豆、胡萝卜归为蔬菜类，便可以大大帮助我们提高记忆效率。

注意，这里分类的作用不只是将一组9个概念，分成每组各有4个、3个和2个概念的3组概念，因为这样还是9个概念，你所要做的是提高一个抽象层次，将大脑需要处理的9个项目变成3个项目。

如果你已经这么做了，恭喜你，你已经在实践黄金三步了：

定义问题：冰箱空了，需要购买补给。
分解问题：你要分析购买哪些东西呢？
归类分组：为了方便记忆，你将要买的9个东西按性质分成了三组，形成如下的金字塔结构。

这就是结构化思维，下次你再接到老婆这样的“需求”，记得把这个方法论用上，她一定会对你刮目相看。

在工作汇报中的运用

定义问题

“小张，客户对销售报告和库存报告不满意，你去看一下什么原因。” 面对这种典型的工作问题，你打算怎么处理呢？

分解问题

首先，你肯定要去调研客户不满意的原因，经过调查你发现，客户不满意主要有以下原因造成的：

提交报告的周期不恰当；
库存数据不可靠；
获得库存数据的时间太迟；
库存数据与销售数据不吻合；
客户希望能改进报告的格式；
客户希望除去无意义的数据；
客户希望突出说明特殊情况；
客户希望减少手工计算。

虽然你做了大量的工作，调查也很充分。但是，如果你要是把这8个原因直接给老板汇报，估计效果不会太好。你可以自己做个试验，仔细阅读上面的列表3分钟，你能从中获得什么？同样的，你老板看到这样的罗列也会是一脸懵逼，不知道重点在哪。

归类分组

所以我们有必要加上第三步，对问题进行进一步的归类分组，我们可以将8个问题概括为3组：

报告中含有不可靠的数据；
报告的格式混乱；
产生报告的时间太晚，无法采取有效措施

进行分组之后，我们就可以得到如下的金字塔结构：

这种结构化的表达，很明显让问题的表述更加清晰。领导也可以很快抓住问题的要点，并作出相应的决策。当然，这里是为了着重介绍归类分组，真正的汇报你还要提供对应的解决方案，然后让老板做“选择题”。

在写代码时的运用

你遇到一个相当复杂的业务场景，在这个业务操作中，涉及到大量的校验和执行操作。这种代码，如果没有一定的策略，很容易写成大泥球。

定义问题

例如，在我们的业务中有一个商品上架的操作，是一个非常复杂的业务操作。

分解问题

对这种业务问题的分解，通常是产品经理的职责，但是作为工程师也不能完全依赖PRD。因为产品视角和工程视角还是有差别的。

针对“商品上架”，我们做了如下的功能分解：

归类分组

同样，在分解之后，我们需要有一个归类分组的过程。否则，这些步骤的平铺会让代码显得凌乱，不方便记忆和维护。通过分析，我们可以把分解后的步骤分成三个阶段：

初始化阶段
校验阶段
执行阶段

通过黄金三步，我们可以得到如下的金字塔结构：

最后，我们按照这个结构去组织我们的代码，整个代码结构会更加清晰，代码的可维护性也会好很多。

在应用架构中的运用

应用架构主要解决的是模块、组件定义和模块、组件关系的问题。

从宏观层面来说，架构设计也是遵循这三个步骤的。比如，我们的架构要如何分层，分模块、分组件就是在做问题分解。然后，模块和组件要归属在哪个层次，要如何命名，就是在做抽象，在做分类归组。

在综合考虑功能属性+质量属性，然后通过黄金三步，就能得到我们想要的架构设计。例如，我们的COLA 2.0架构也是在这个方法论的指导下完成的。

在产品架构中的运用

定义问题

“小张，为了做新零售，我们打算做一款智能互联网POS机，你先做一下产品设计。”

分解问题

通过调研你发现，作为POS机，其核心功能是收银和经营管理。所以至少需要包含收银的功能、服务核销的功能、商品管理的功能、库存管理的功能等等。

但如果仅仅是满足这些功能，和传统的POS并没有多大的区别，为了满足“智能”和“互联网”的要求，你去深入百度了一下智能POS应该具备的功能，大致包含以下功能：

刷脸支付；
支持品牌商营销；
支持自主营销；
智能定价；
外卖对接；
彩票对接；
虚拟充值等等。
在问题分解阶段，我们应该尽量多的收集信息，多发散，多头脑风暴。

归类分组

发散完，我们还是要收回来。在收敛之前，我们先看一下产品框架应该包含哪些东西，通常，一个产品架构至少要包含三个层次：

用户感知层（在何种场景下通过何种方式触达用户）；
功能模块层（通过哪些功能模块实现产品的核心功能，和哪些外部平台功能有信息交互）；
数据层（产品的数据从哪里来、产品的数据沉淀到何处去）。
在这三个层次的基础上，我们再对每个层次内的模块进行分组。例如在功能模块层，我们要对功能进行分类，让分散的功能点内聚成更大的产品模块（体现在用户界面上，往往是一级菜单和子菜单的关系）。

比如对于POS的收银产品模块，我们可以提供以下的产品功能：

支付宝收银
现金收银
微信收银
刷脸支付
记账等

通过层次划分，模块划分我们就可以得到一个相对清晰的产品架构，以智能POS为例，我们可以画出如下的产品架构：

分类是科学也是艺术

通过上面的案例，我想你已经领会到黄金三步：定义问题——分解问题——归类分组的要义了。其中前两步相对比较直观，而第三步往往是不容易做好，也容易被忽略的关键步骤。

实际上，对事物的归类分组是我们人类的天性。人类大脑会自动将发现的所有事物以某种持续组织起来。基本上，大脑会认为同时发生的任何事物之间都存在某种关联，并且会将这些事物按某种逻辑模式组织起来。

比如，下面这张图片：

无论是谁，乍一看到上面的六个黑点，都会认为共有两组墨点，每组三个。造成这种印象的原因主要是有些黑点之间的距离比另一些黑点之间的距离大。

空间是一个相对比较直观的逻辑关系，然而，并不是所有的逻辑关系都是如此的显性化。实际上，很多的概念会在多个维度进行交叉耦合，这就给我们的归类分组带来了很大的挑战。

生物分类学

生物分类学通常直接称分类学（Taxonomy），是一门研究生物类群间的异同以及异同程度，阐明生物间的亲缘关系、基因遗传、物种进化过程和发展规律的基础科学。

最流行的分类是五界系统。通常包括七个主要级别：界（Kingdom）、门（Phylum）、纲（Class）、目（Order）、科（Family）、属（Genus）、种（Species）。种（物种）是基本单元，近缘的种归合为属，近缘的属归合为科，科隶于目，目隶于纲，纲隶于门，门隶于界。

不过分类学到不是一门很严谨的“科学”。就像比尔.布莱森在《万物简史》里说的：

分类学有时候被描述成一门科学，有时候被描述成一种艺术，但实际上那是一个战场。即使到了今天，那个体系比许多人认为的还要混乱。以描述生物基本结构的门的划分为例。许多生物学家坚持认为总数30个门，但有的认为20来个门，而爱德华在《生命的多样性》一书里提出的数字高达令人吃惊的89门。

由此可见，分类并不像我们想的那么简单。我们观察事物的视角不同，对问题的认知程度不同，得出来的分类很可能也完全不同。

特别是当概念之间有交叉情况，分类就会变得更加棘手。比如，在你的笔记本中，有“读书笔记”和“哲学笔记”两个平级的分类，此时你阅读了一本哲学书籍，那么你会把这本书的读书笔记放在哪个分类里呢？

分类的原则

分类的基本原则是MECE法则。透过结构看世界，说的就是MECE法则。

MECE法则即mutually exclusive collectively exhaustive的缩写，是麦肯锡咨询顾问芭芭拉·明托在《金字塔原理》中提出的一个思考工具，意思是“相互独立，完全穷尽”，也常被称为“不重叠，不遗漏”。

MECE原则的思想精髓，就是全维度的去分析一件事情，不要有遗漏和重复的部分。

我们可以借助已有的结构化思维模型（分类的框架）来分析问题，确保每一层要素之间“不重复、不遗漏”。

分类的思维模型

实际上，在上文中我们已经提到了一些分类的思维模型。比如，在应用架构中，我们通常有展现层、控制层、应用层、领域层和基础实施层；在产品架构中，有用户感知层、功能模块层、数据层。这些框架可以有效的指导我们在各自领域中开展工作。

类似于这样的分类思考模型还有很多，比如：
1、制定市场营销策略的“4P”模型，即产品策略（Product Strategy）、价格策略（Price Strategy）、渠道策略（Place Strategy）、促销策略（Promotion Strategy）。

2、分析问题的“5W2H”模型，即Why、What、Who、When、Where、How和How much。

3、思考组织战略的“7S”模型，即经营策略（Srategy）、组织结构（Structure）、运营系统（System）、经营风格（Style）、职员（Staff）、组织技能（Skill）和共享价值观（Shared value）。

4、分析竞争力的SWOT模型，SWOT分析代表分析企业优势（Strengths）、劣势（Weakness）、机会（Opportunity）和威胁（Threats）。

5、制定目标的SMART模型，即制定目标要满足确定性（Specific) 、可度量性（Measurable）、可实现性（Attainable）、相关性（Relevant）和时效性（Time-based）。

这些思维模型都是宝贵的经验总结，相当于已经帮我们做好了第三步“归类分组”的工作，我们只需要按照模型制定的框架往里面填充要素即可。

因此擅用模型，活用框架。可以极大的提升我们解决问题的效率，同时帮助我们做更加全面的、更加结构化的思考。做了“无遗漏，不重复”。

2010年5月中的最新暴强状态+语录

2010-05-25 by wwek·0评论

1、某人一个月前的签名：“脂肪我跟你拼了！” 一个月后的签名：“脂肪你赢了……
2、“不要再意YIN了”这句话终于有了正式的英文翻译!那就是:Stop telling your Korean jokes!
3、twins这对组合真神了：一个被干全世界都知道了，一个被干全世界都不知道。
4、山东作协副主席王兆山再推抗旱新作: 西南万里赤日炎,禾稻枯焦古井燃.星空顿洒总理泪,疑是茅台落九天
5、广州一年轻男子在网吧挥刀自宫，抗拒做手术。一位猫扑网友评论道：“猜测不错的话，丫得了性病，然后baidu了”
6、想当年,前辈们抛头颅洒热血的为我们打下了均价每平超过两万五的江山……….
7、郭德纲响应广电部号召，说相声拒用英文缩写:"有钱我找一台湾女子乐团到家演堂会,内乐团名字叫射"…于谦:"宝贝儿内叫SHE…
8、一小姐深夜被蒙面人强.暴，她在派出所分析说：民工皮肤没这么好；工人东西没这么小；光棍射的没这么少；老人硬的没这么早，综合分析是领导.
9、其实，成功很简单。只要几年前就给自己买了房，还给父母买了墓.
10、朋友，你沮丧吗，你压抑吗，你缺乏自信吗？请立即购买一份《环球时报》，把“中国”替换为“我”，包管你五分钟内自信心爆棚，徒手敢撬原丨子弹，马步能阻七十码.
11、如今，几乎只剩下当老板一种职业不需要大学文凭了.
12、上海张江地铁站某臭豆腐摊的广告语：Smell Smelly, Taste Tasty! 人才啊。
13、中华民族是个有智慧的民族，比如为了解决交通拥挤的问题，就发明了错峰上下班的方法．再比如为了解决房价高的问题，就发明了错峰买房的方法，具体来说就是：有的人这辈子买，有的人下辈子买。
14、中国式经济学：GDP = 搞地皮
15、一般新浪微博都是140个字吧，163的微博可以输入163个字，我也在寻思360安全卫士要是出个微博是不是得输入360个字？网友纷纷表示51.com和 56.com会压力很大。其实我一直在等2688网店和3721网络实名出微博。猫扑网友说，其实，移动10086也在酝酿微博……
16、灾难中易出现的“道德”闹剧：1、逼人捐款；2、逼人表爱心；3、逼人做出悲伤的表情；4、认为自己比他人更有爱。

继续阅读

分类： 技术管理

title: 使用N8N工作流自动化解决三方API数据对接

0、n8n是什么？

1、安装

2、需求案例

3、n8n实现

4、参考

背景

DolphinScheduler中配置DataX MySQL To MySQL工作流

工作流定义

保存工作流

爬坑记录

参考

背景

DolphinScheduler中配置DataX MySQL To MySQL工作流

工作流定义

保存工作流

爬坑记录

参考

数据同步的方式

数据同步的2大方式

基于SQL查询增量数据同步原理

DolphinScheduler + Datax 构建离线增量数据同步平台

DolphinScheduler中配置DataX MySQL To ElasticSearch工作流

工作流定义

保存工作流

参考

在日常生活中的运用

在工作汇报中的运用

定义问题

分解问题

归类分组

在写代码时的运用

定义问题

分解问题

归类分组

在应用架构中的运用

在产品架构中的运用

定义问题

分解问题

归类分组

分类是科学也是艺术

生物分类学

分类的原则

分类的思维模型

分类：技术管理