分类目录归档:不是技术

紫微斗数

本来我是没想起来要算这个,但是担心向航他爷爷先算了,感觉就不大好,于是先排一下,心中有个底。

设私密吧,小宝有一天会自己看到。

大概是擎羊坐命庙,对宫迁移武贪同行。说是要远行,先贫后富。

截一些说法如下:

命宫:命宫无主星,擎羊单星在未宫入命宫,称为 ﹝擎羊入庙格﹞。这样格局的人,个性刚猛,处事勇敢、果决、积极,有惊人的胆识与毅力,能不中断的往前冲刺,不畏障碍困难,性情坚强,勇于尝试新的事物,反应快而有效率,有很强的开创及领导能力,能为高官或做大事业之人。但易让周边的亲友捏把冷汗。所以宜离祖远行,六情较无依。古曰:﹝三煞加临庙旺宫,性情刚猛震英雄。几番险地都经过,凛凛威权众罕同﹞。
擎羊未宫入命者,对宫为武贪,武曲为财星重视当下,贪狼星代表欲望,此组星系性质,权欲之心甚重,再见擎羊入庙格,可以视为人生观极为积极的星系。拼劲十足不太容易静下来,喜欢为事业钱财而打拚,经商能富贵声扬。

此格虽富贵,须防有刑殇暗疾或痼疾缠身。但还须多修心养性,谨慎小心利用「擎羊」此星,刀为两面刃,易伤害别人,也会让自己受伤。

迁移:武曲贪狼坐迁移,经云:「贪武同行,威镇边夷」。在结构上利于早年离乡出外发展,他乡得意。

擎羊在辰、戌、丑、未独坐命宫,称为 ﹝擎羊入庙格﹞,在辰戌位对宫为「天机、天梁」对照,在丑未位对宫为「武曲、贪狼」对照,或「太阳、太阴」与「天同、巨门」,在这几组星系中以未宫坐命,己年生人,对宫为「武曲化禄、贪狼化权」的格局最高,可真正主权贵。命坐未宫虽无主星,但武曲贪狼坐迁移,为「武贪同行格」。虽不入武贪格,但迁移宫得到日月并明夹。三合还有天相坐守财帛宫,官禄宫为天府拱照,称「府相朝桓格」,为多格局之组合,有相当的高贵度。擎羊代表权威,果决。坐命者事业心强,再遇武贪二星,反而是助力,遇事积极、勇敢、果决,气味相投。此格之人,武人官掌兵权,经商者为大富翁。但还须多修心养性,谨慎小心利用「擎羊」此星,刀为两面刃,易伤害别人,也会让自己受伤。

JSPHP NLP工作流

这个JSPHP NLP工作流的标题有点拗口,但目前仍难以作为独立服务发布,后面再取一个好听的名字吧。

高大上一点就是,我考虑的是如何利用有限的web空间/运算资源,实现规模略大的运算

我去年买了这个无限量存储的PHP web hosting,放弃了用了好几年的VPS。原因是VPS被攻击风险越来越大,用于VPN效果又不好,而多放几个网站存储上就有点累了。

但是纯粹的host缺点也是很明显的,我不能再在PHP下面自由添加一些扩展库了,更多的时候,只能使用纯粹的PHP进行运算。另外,单个PHP页面运算资源也是有限的,超时、内存限制等都不能自由修改。

不过是缺点也是挑战,于是当我考虑用这个host来进行一些NLP运算和统计工作的时候,我不得不考虑将运算过程进一步分解成若干个独立的小任务,这些小任务运算时间和资源都有一定限制。将这些小任务串联起来的工作,就落在前端的javascript上。

问题来了,为什么不在javascript上完成一切?

继续阅读

Notepad++里面的正则

其实用起来还好,唯一需要注意的是对GB*编码的支持不力,最好转成UTF-8再进行操作。

跟以前整理的UE里面的正则是类似的。

学到一些新的技能,因为在文本分词统计中发现一些名词出来的数量太少,于是找了找原文,发现原文里面既有简体也有繁体,另外还有错字别字。哪吒写成那吒之类。于是数据统计出来便失真了。

但不细看原文很难知道它哪里写错了,于是要用正则来检索。

比如我搜“八臂哪吒”要比“八臂”要少很多,但是后者肯定不是一个常用的词语,如果不在原文中查找具体位置中出现的问题,就要这么搜:“八臂(?!哪吒)”

这样就很快定位出不一样的八臂所在。

innerHTML和value

写了一个textarea,用js去提取内容。

开始的demo里面是用getElementById().innerHTML去拿,发现是OK的,后来改写页面,textarea里面的内容由用户自己修改,然后点某个href去触发js函数再去取,就不行了。

而换IE是好的。

查查了一个小时左右,才定位到innerHTML的不足。Chrome里面,这个textarea的innerHTML如果没有触发浏览器的刷新事件,那么不会更新,反复取只得上一个值。

这个刷新发生在什么时候?我估计可以是js内部修改,也可以是浏览器其他事件发生,比如submit等。

回到这个问题本身,如何让js在chrome中及时取到正确的内容,搜了一下,改成用value去取就OK了。

 

用户研究

今天翻CSDI的PPT,看到有产品经理相关的内容,其中一页列举了在对待新技术层面上的五种用户类型。

其中有 技术狂热者,他们一般是创新者,开创一些新的技术并可能产品化,但另一方面,对市场需求并不是那么敏锐,因为注意力集中在技术创新上了。

第二类是有远见者,他们一般是技术的早期采用者。

第三类是实用主义者,他们一般是新技术起来后的早期使用大众。

第四类是保守主义者,他们一般是等新技术已经广泛铺开后的后期使用大众。

最后一类是怀疑者,他们是落后于技术趋势的。

如果一个公司的核心管理层,完全处在保守主义者和怀疑者掌控之中,那么基本上,已经与创新没有多大关系了。此类型公司的策略,更多的是利用后发优势以及平台优势,在市场上陆续消灭那些根基不牢的竞争对手。

 

Soot的过程

soot Phrases

Soot的标准过程无非就是从Classes到Jimple Bodies再到Baf Bodies再到Classes的过程。

先看这个是必要的。理解了Soot的过程,才知道在哪里插入修改,然后又达到些什么目的。

主要参考文章:Packs and phases in Soot(2008) 

从jb开始:所有的非系统方法都有jb,而jb生成的过程是不可修改的,可以理解成这是一个忠于原著的内容翻译过程。

下一步是cg:生成整个调用图。此阶段的修改适用于调用关系分析,以至一些污点传染分析等。

再下一步是whole program:注意到wjtp->wjop->wjap和后面的jtp->jop->jap是类似的,只是前者针对全局进行处理。wjtp的过程的修改适用于加入inter-analysis(全程序范围分析),可用于soot.Main里面修改一些context?猜测的。wjop的过程修改适用于全局替换或插入?wjap,不清楚。

w-*的过程默认是不打开的,要使用的话需要显式指定soot启用w过程(-w)。

而jtp,用于加入intra-analysis,在方法中增加一些锚点等。默认打开。

jop,默认不打开。可用于混淆代码?猜测的。

jap,默认打开,但内部所有过程是关闭的。需要程序中根据需要使能。

 

持续更新。

 

 

在Soot之前有分析过的一些工具

这里列举一下,就当是备份了。

首先看的是QARK,基于python和JRE1.6的一个工具,运行在OSX和*nix上,(值得留意的是,在最近的查找中,windows上的支持越来越少了),主要是漏洞检测工具。类似的Java代码漏洞检测工具不少,但不是我想要的。我想要的是一个容易理解和修改的污点检测工具,用来跟踪敏感数据的流向。

SPARTA/DARPA,一个大学项目,要得到源代码,然后依赖于人工添加注释的方法得到信息流,source(源),sink(流向)的数据。提供一个检查框架,依赖于半自动的方式检查APK里面的malware风险。由于是人工参与,所以成本控制方面并不理想。需要a.训练相关的人检查,b.需要开发者提供代码并有效注释。

继续阅读

Soot初入

很抱歉的是很久很久没有做过Java工程了,加上Soot又是一个历史很悠久的项目,而用者也不多。

这是一个反编译并重新优化/修改/混淆代码的Java分析框架。

以下是一些Java的基础,哭。

JAVA_HOME

CLASSPATH,用于jvm运行时查找相关class的,如果当前路径查找,必须加入”.”。相关的.jar如果不想-cp(classpath的缩写),也必须加入CLASSPATH。

有包路径的class,直接查找是不行的,要构造个包……

继续阅读

自建CA的考虑

从业务闭环的角度思考,需要有CA (Root)的存在,然而使用商业的CA服务,按证书收费,这不是普通体量的公司能承担的,而IoT设备的数量远超网站需要,因此物联网公司直接去买海量的证书也不划算。

因此,必须是自有的CA服务,然而,到底是托管型合适还是自建合适呢?

就目前国内的情况来说,各种托管型的CA产品也有,只是不清楚其质量,以及面向全球访问的能力是否足够?因此自建其实也是合理的。

自建的需要考虑一些规格上的问题,比如:

CA软件系统:自己开发还是OpenCA或其他?

操作系统

服务器配置

数据库的选择,或是否支持多种数据库

目录访问,LDAP?AD?

热备方案

日志方案及多级规格,签名访问

审计的需求

支持何种HSM?

CA业务系统的技术方案

支持的证书量规模。。。。。。这个取决于业务的规模,如果使用可扩展的方案,则技术难度会稍大。

—————-

CA系统的物理环境(机房等)

—————-

CA系统的管理制度,运维规则

about fingerprint scanner

指纹器/模块其实一般是输出一个512×512的点阵图像的,可能是二值的也可能是灰度的。

对于输出的要求一般有认证的标准。目前看到的,FBI PIV IQS(Image Quality Standard),关于图像质量的认证,BSI(British Standards Institution)认证,Indian STQC认证。

从兼容性考虑,也有FIDO方面的规范。

中国国内的是GB/T 26237.8-2014,但估计并不强烈进行推动。

指纹器收集指纹图像后,后台需进行压缩保存,一般是JPEG/WSQ/EZW等格式,WSQ为FBI所用,EZW是中国公安部所用。WSQ这个算法的使用也是需要认证的。

这么看下来,如果是基于二值/灰度图像的格式,指纹模块应该是比较通用的技术才对。